هوش مصنوعی جدید Z.AI وظایف یک روز کاری را بهصورت مستقل انجام میدهد
شرکت Z.AI هوش مصنوعی جدید GLM-5.1 را معرفی کرد. این مدل بهطور خاص برای ساخت ایجنتهایی که بتوانند کارهای پیچیده را بهصورت خودکار انجام دهند، طراحی شده است. مدل جدید GLM منبعباز است و به رقابت مدلهای هوش مصنوعی گرانقیمت میرود.
برخلاف مدلهای قبلی که برای پاسخگویی سریع و ساده مناسب بودند، GLM-5.1 برای انجام وظایف طولانیمدت ساخته شده و توانایی کدنویسیاش بهشکل قابلتوجهی بهبود یافته است. این مدل در آزمون SWE-Bench Pro بهترین نتیجه را کسب کرد و در کارهای مربوط به تولید مخزن کد (NL2Repo) و انجام وظایف با استفاده از خط فرمان (Terminal-Bench 2.0)، بهطور چشمگیری از GLM-5 بهتر عمل میکند.
GLM-5.1 بر اساس معماری خاصی ساخته شده که با مدلهای استاندارد هوش مصنوعی متفاوت است. این مدل از روشی به نام DSA برای کاهش هزینههای آموزش استفاده میکند، بدون اینکه دقتش کم شود. همین ویژگی باعث میشود GLM-5.1 برای پردازش اطلاعات بسیار سریعتر باشد.
در فرآیند آموزش، GLM-5.1 از سیستم جدید «یادگیری تقویتی غیرهمزمان» استفاده میکند که کارایی مدل را پس از آموزش افزایش میدهد. این سیستم به مدل کمک میکند تا از طریق تعاملات پیچیده و طولانیمدت، بهتر یاد بگیرد و تصمیمهای درستی بگیرد.
یکی از مشکلات اصلی مدلهای قبلی هوش مصنوعی هنگام استفاده بهعنوان ایجنت، اتمام سریع تواناییها بود. این مدلها پس از انجام چند کار ساده، به بنبست میرسیدند و دیگر پیشرفتی نداشتند. مهمترین ویژگی GLM-5.1، تواناییاش در انجام وظایف طولانیمدت است. این مدل میتواند تا ۸ ساعت (یک روز کاری) بهطور خودکار روی یک کار واحد کار کند و فرآیند کامل برنامهریزی، اجرا، آزمایش و رفع اشکال را بدون دخالت انسان انجام دهد.
GLM-5.1 در آزمون SWE-Bench Pro امتیاز ۵۸٫۴ را کسب کرد که از GPT-5.4 و Claude Opus 4.6 و جمنای ۳٫۱ پرو بیشتر است. در سایر آزمونها نیز GLM-5.1 عملکرد خوبی بهنمایش گذاشت: ۹۵٫۳ در AIME 2026 و ۹۴٫۰ در HMMT Nov. 2025 و ۸۲٫۶ در HMMT Feb. 2026 و ۸۶٫۲ در GPQA-Diamond (یک آزمون علمی پیشرفته).
در مجموع، GLM-5.1 هوش مصنوعی قدرتمند و همهکارهای است که میتواند در زمینههای مختلفی مانند استدلال، کدنویسی، ساخت ایجنت و جستوجو در اینترنت استفاده شود. عملکرد کلی و توانایی کدنویسی GLM-5.1 با Claude Opus 4.6 قابل مقایسه خواهد بود.
برای توسعهدهندگانی که میخواهند ایجنتهای خودکار بسازند، GLM-5.1 فرصتهای جدیدی ایجاد میکند. بهجای اینکه مدل را در طول چندین مرحلهی کوتاه کنترل کنند، میتوانند یک هدف پیچیده را به GLM-5.1 بدهند و صبر کنند تا فرآیند کامل «آزمایش–تحلیل–بهینهسازی» را بهطور خودکار انجام دهد.
GLM-5.1 میتواند یک محیط دسکتاپ لینوکس را از ابتدا در ۸ ساعت بسازد، ۱۷۸ دور تکرار خودکار روی یک کار دیتابیسی برداری انجام دهد و عملکرد را به ۱٫۵ برابر نسخهی اولیه برساند.