فناوری

مدل چینی GLM-۵.۲ با شکست Claude Fable 5 صدرنشین بنچمارک طراحی وب شد

دیجیاتو digiato نظرات: ۰ 2 ساعت پیش زمان تقریبی مطالعه: 3 دقیقه

در رویدادی غافلگیرکننده برای دنیای هوش مصنوعی، جدیدترین مدل شرکت چینی Zhipu AI یعنی GLM-۵.۲، موفق شد با کنار زدن Claude Fable 5 رتبه نخست یکی از معتبرترین بنچمارک‌های کدنویسی خلاقانه را از آن خود کند.

اخیراً پلتفرم Design Arena در شبکه اجتماعی ایکس اعلام کرده که مدل GLM-۵.۲ جایگاه اول را در جدول امتیازات طراحی وب تک‌مرحله‌ای HTML (در دسته بدون ایجنت) تصاحب کرده است. این پلتفرم اعلام کرد که مدل چینی توانسته مدل Claude Fable 5 و همچنین نسخه‌های Opus 4.6 و 4.7 از آنتروپیک را شکست دهد. این موفقیت نشان‌دهنده جهش صعودی ۵ پله‌ای نسبت به نسخه قبلی یعنی GLM-۵.۱ است و امتیاز این مدل را در بخش کدنویسی به حدود ۱۳۶۰ رسانده است.

عملکرد خیره‌کننده مدل هوش مصنوعی GLM-۵.۲

چیزی که این پیروزی را متمایز می‌کند، نحوه طراحی این مدل است. این مدل هوش مصنوعی در ایجاد چیدمان‌های تمیز، فراخوانی تصاویر از شبکه‌های توزیع محتوا (CDN)، تایپوگرافی، سلسله‌مراتب بصری و استفاده از انیمیشن‌های ظریفی که باعث پویایی سایت می‌شوند، عملکرد فوق‌العاده‌ای دارد. علاوه‌براین، هماهنگی بسیار بالایی با کتابخانه‌های محبوبی مانند Chart.js و Three.js دارد.

یک نکته جالب توجه اینکه مدل GLM-۵.۲ اتکای زیادی به چارچوب Tailwind CSS دارد و در ۹۱ درصد از طراحی‌های خود از آن استفاده کرده است؛ همچنین در ۵۱ درصد موارد از Font Awesome بهره برده است. در مقایسه، مدل Fable 5 تنها در ۵۷ درصد مواقع از Tailwind استفاده کرده که این موضوع می‌تواند تا حدودی فاصله‌های کاربردی مشاهده‌شده توسط کاربران را توصیف کند.

در کنار کیفیت طراحی، قیمت‌گذاری این مدل نیز بسیار نویدبخش است. هزینه استفاده از API مدل GLM-۵.۲ در حدود ۱.۴۰ دلار به ازای هر میلیون توکن ورودی و ۴.۴۰ دلار برای هر میلیون توکن خروجی است که به مراتب مقرون‌به‌صرفه‌تر از قیمت ۱۰ دلار ورودی و ۵۰ دلار خروجی مدل Fable 5 است. علاوه‌براین، GLM-۵.۲ یک مدل متن‌باز با وزن‌های در دسترس تحت مجوز MIT است که از پنجره ۱ میلیون توکنی بهره می‌برد؛ این ویژگی به تیم‌های توسعه‌دهنده اجازه می‌دهد تا مدل را به‌صورت محلی اجرا کنند و پروژه‌های بزرگ‌تر و طولانی‌تر را بدون وابستگی به سرویس‌های انحصاری پیش ببرند.

رویکرد پلتفرم Design Arena به این نتایج اعتبار زیادی می‌دهد؛ چرا که میلیون‌ها رأی از سوی طراحان واقعی و با تمرکز بر زیبایی‌شناسی و کاربردپذیری واقعی ثبت شده است و نتایج آن متکی بر آزمون‌های مصنوعی نیست. این دستاورد نه‌تنها یک پیروزی در زمینه طراحی وب است، بلکه مدل GLM-۵.۲ را در میان قوی‌ترین مدل‌های متن‌باز در بنچمارک‌های گسترده‌تر کدنویسی نیز قرار می‌دهد. برای جامعه هوش مصنوعی، این موفقیت نشانه دیگری از حرکت سریع آزمایشگاه‌های چینی در حوزه‌های خلاقانه تخصصی است و با توجه به ترکیب عملکرد قوی، هزینه پایین و متن‌باز بودن، می‌تواند این مدل را به انتخاب اول بسیاری از تیم‌های توسعه وب تبدیل کند.