ادعای شرکت چینی: هوش مصنوعی ما در طراحی وبسایت از Fable 5 بهتر است
مدل متنباز GLM 5.2 شرکت Z.ai موفق شد در ارزیابی تکمرحلهای طراحی وب HTML پلتفرم Design Arena به رتبهی نخست برسد و پنج پله بالاتر از نسل قبل، یعنی GLM 5.1، قرار بگیرد.
GLM 5.2 در مسیر رسیدن به صدر جدول، رقبایی مانند Claude Fable 5 و Opus 4.6 و Opus 4.7 را پشت سر گذاشت؛ خانوادهای از مدلها که ماهها در صدر رتبهبندیهای طراحی وب قرار داشتند.
دستاورد GLM 5.2 از آن جهت اهمیت دارد که با مجوز MIT منتشر شده و درحالی به این نتیجه رسیده که همچنان از ۷۴۴ میلیارد پارامتر بهره میبرد؛ همان اندازهای که در GLM 5.1 دیده میشد. همچنین فاقد قابلیت پردازش تصویر است، درحالیکه برخی رقبا تا ۶٫۷ برابر بزرگتر برآورد میشوند.
GLM 5.2 از نظر نسبت کیفیت به هزینه نیز عملکرد چشمگیری دارد. هزینهی استفاده از GLM 5.2 برابر ۱٫۴۰ دلار برای ورودی و ۴٫۴۰ دلار برای خروجی هر یک میلیون توکن اعلام شده؛ در مقابل، Claude Fable 5 بهترتیب ۱۰ و ۵۰ دلار هزینه دارد.
البته GLM 5.2 در همهی حوزهها بهترین نیست. Claude Fable 5 همچنان در دستههای توسعهی بازی، مصورسازی داده و طراحی سهبعدی رتبهی اول را در اختیار دارد و GLM 5.2 در این بخشها دوم شده است و در رتبهبندی طراحی رابط کاربری، جایگاه چهارم را کسب میکند.
بررسیها نشان میدهد مهمترین نقطهی قوت GLM 5.2 تولید کدی است که بدون خطا اجرا میشود. مدل در استفاده از کتابخانههایی مانند Chart.js و Three.js عملکرد بسیار بهتری نسبتبه رقبا دارد و همین موضوع نرخ موفقیتش را بهطور محسوسی افزایش داده میدهد. استفاده از Tailwind CSS در ۹۱ درصد درخواستها و Font Awesome در ۵۱ درصد موارد به بهبود کیفیت خروجیها کمک میکند.
مدل جدید وبسایتهایی با طراحی پیچیدهتر، انیمیشنهای بیشتر و تنوع بالاتر در تایپوگرافی و چیدمان تولید میکند. این رویکرد بهویژه در صفحات لندینگ و وبسایتهای تبلیغاتی نتایج بهتری بههمراه داشته است. در مقابل، زمان تولید محتوا افزایش یافته و میانگین زمان ساخت پروژهها به بیش از ۳۰۰ ثانیه میرسد؛ تقریباً دو برابر Claude Fable 5.
نکتهی جالب دیگر، استفادهی گسترده از قالبهای طراحی آماده در GLM 5.2 است. هرچند خروجیهایش گاهی شباهتهایی به یکدیگر دارند: اما کاربران این قالبها را جذابتر از نمونههای تولیدشده توسط بسیاری از مدلهای رقیب ارزیابی کردهاند.
در مجموع، GLM 5.2 یکی از بزرگترین پیشرفتهای اخیر در دنیای مدلهای متنباز بهشمار میرود و نشان میدهد فاصلهی میان مدلهای متنباز و پیشرفتهترین مدلهای تجاری بیشاز هر زمان دیگری کاهش یافته است.