هوش مصنوعی قدرتمند و آفلاین برای برنامه‌نویسی؛ علی‌بابا از Qwen 3.6 رونمایی کرد

پنج‌شنبه 3 اردیبهشت 1405 - 17:35
مطالعه 2 دقیقه
آموزش زبان با هوش مصنوعی
هوش مصنوعی جدید علی‌بابا با پیشرفت قابل توجه، یکی از بهترین مدل‌ها برای برنامه‌نویسی است.
تبلیغات

تیم Qwen شرکت علی‌بابا هوش مصنوعی جدید Qwen3.6-27B را منتشر کرد؛ نخستین مدل Dense در خانواده‌ی Qwen3.6 که به‌صورت رایگان و محلی در دسترس قرار می‌گیرد و به گفته این تیم، یکی از قدرتمندترین مدل‌های ۲۷ میلیارد پارامتری برای برنامه‌نویسی محسوب می‌شود.

مدل جدید Qwen نسبت‌به نسل قبل بهبود قابل توجهی در «کدنویسی ایجنت‌محور» دارد و از مکانیزم تازه‌ای به‌نام «حفظ تفکر» (Thinking Preservation) بهره می‌برد.

انتشار Qwen3.6-27B چند هفته پس از معرفی مدل MoE با نام Qwen3.6-35B-A3B انجام می‌شود؛ مدلی که تنها ۳ میلیارد پارامتر فعال دارد. نسخه‌ی جدید در برخی بنچمارک‌ها عملکرد بهتری نسبت‌به آن و مدل بزرگ‌تر Qwen3.5-397B-A17B ثبت کرد. تمرکز مدل ۲۷ میلیارد پارامتری بیشتر بر پایداری و کاربرد واقعی است، نه صرفاً بهینه‌سازی برای نتایج آزمایشگاهی.

در بخش کدنویسی، این مدل برای درک ساختار پروژه‌ها، ویرایش چند فایل به‌صورت هم‌زمان و تولید خروجی قابل اجرا بهینه شده است.

هوش مصنوعی جدید علی‌بابا در بنچمارک QwenWebBench امتیاز ۱٬۴۸۷ را ثبت کرد که نسبت‌به نسل قبل جهش محسوسی دارد و در آزمون‌های دیگری مانند NL2Repo و SWE-bench عملکردی رقابتی به‌نمایش گذاشت.

پخش از رسانه

قابلیت «حفظ تفکر» امکان حفظ و استفاده از مسیر استدلال پیام‌های قبلی را فراهم می‌کند. اغلب مدل‌ها تنها استدلال پیام جاری را نگه می‌دارند. این ویژگی در سناریوهای چندمرحله‌ای باعث کاهش مصرف توکن و بهبود کارایی می‌شود.

Qwen3.6-27B به‌صورت بومی و چندوجهی طراحی شده و از ورودی‌های متنی، تصویری و ویدیویی پشتیبانی می‌کند. این مدل در دو نسخه‌ی BF16 و FP8 منتشر شده و با ابزارهایی مانند Hugging Face Transformers و vLLM و SGLang سازگار است.

نظرات