هوش مصنوعی جدید Z.AI وظایف یک روز کاری را به‌صورت مستقل انجام می‌دهد

هوش مصنوعی

فناوری

یک‌شنبه 23 فروردین 1405 - 13:10

مطالعه 2 دقیقه

تیم زومیت

جدیدترین مدل هوش مصنوعی Z.AI، برای انجام وظایف پیچیده و طولانی‌مدت طراحی شده است و در کدنویسی عملکرد بسیار خوبی دارد.

تبلیغات

شرکت Z.AI هوش مصنوعی جدید GLM-5.1 را معرفی کرد. این مدل به‌طور خاص برای ساخت ایجنت‌هایی که بتوانند کارهای پیچیده را به‌صورت خودکار انجام دهند، طراحی شده است. مدل جدید GLM منبع‌باز است و به رقابت مدل‌های هوش مصنوعی گران‌قیمت می‌رود.

برخلاف مدل‌های قبلی که برای پاسخ‌گویی سریع و ساده مناسب بودند، GLM-5.1 برای انجام وظایف طولانی‌مدت ساخته شده و توانایی کدنویسی‌اش به‌شکل قابل‌توجهی بهبود یافته است. این مدل در آزمون SWE-Bench Pro بهترین نتیجه را کسب کرد و در کارهای مربوط به تولید مخزن کد (NL2Repo) و انجام وظایف با استفاده از خط فرمان (Terminal-Bench 2.0)، به‌طور چشمگیری از GLM-5 بهتر عمل می‌کند.

GLM-5.1 بر اساس معماری خاصی ساخته شده که با مدل‌های استاندارد هوش مصنوعی متفاوت است. این مدل از روشی به نام DSA برای کاهش هزینه‌های آموزش استفاده می‌کند، بدون اینکه دقتش کم شود. همین ویژگی باعث می‌شود GLM-5.1 برای پردازش اطلاعات بسیار سریع‌تر باشد.

در فرآیند آموزش، GLM-5.1 از سیستم جدید «یادگیری تقویتی غیرهمزمان» استفاده می‌کند که کارایی مدل را پس از آموزش افزایش می‌دهد. این سیستم به مدل کمک می‌کند تا از طریق تعاملات پیچیده و طولانی‌مدت، بهتر یاد بگیرد و تصمیم‌های درستی بگیرد.

یکی از مشکلات اصلی مدل‌های قبلی هوش مصنوعی هنگام استفاده به‌عنوان ایجنت، اتمام سریع توانایی‌ها بود. این مدل‌ها پس از انجام چند کار ساده، به بن‌بست می‌رسیدند و دیگر پیشرفتی نداشتند. مهم‌ترین ویژگی GLM-5.1، توانایی‌اش در انجام وظایف طولانی‌مدت است. این مدل می‌تواند تا ۸ ساعت (یک روز کاری) به‌طور خودکار روی یک کار واحد کار کند و فرآیند کامل برنامه‌ریزی، اجرا، آزمایش و رفع اشکال را بدون دخالت انسان انجام دهد.

GLM-5.1 در آزمون SWE-Bench Pro امتیاز ۵۸٫۴ را کسب کرد که از GPT-5.4 و Claude Opus 4.6 و جمنای ۳٫۱ پرو بیشتر است. در سایر آزمون‌ها نیز GLM-5.1 عملکرد خوبی به‌نمایش گذاشت: ۹۵٫۳ در AIME 2026 و ۹۴٫۰ در HMMT Nov. 2025 و ۸۲٫۶ در HMMT Feb. 2026 و ۸۶٫۲ در GPQA-Diamond (یک آزمون علمی پیشرفته).

در مجموع، GLM-5.1 هوش مصنوعی قدرتمند و همه‌کاره‌ای است که می‌تواند در زمینه‌های مختلفی مانند استدلال، کدنویسی، ساخت ایجنت و جست‌وجو در اینترنت استفاده شود. عملکرد کلی و توانایی کدنویسی GLM-5.1 با Claude Opus 4.6 قابل مقایسه خواهد بود.

برای توسعه‌دهندگانی که می‌خواهند ایجنت‌های خودکار بسازند، GLM-5.1 فرصت‌های جدیدی ایجاد می‌کند. به‌جای اینکه مدل را در طول چندین مرحله‌ی کوتاه کنترل کنند، می‌توانند یک هدف پیچیده را به GLM-5.1 بدهند و صبر کنند تا فرآیند کامل «آزمایش–تحلیل–بهینه‌سازی» را به‌طور خودکار انجام دهد.

GLM-5.1 می‌تواند یک محیط دسکتاپ لینوکس را از ابتدا در ۸ ساعت بسازد، ۱۷۸ دور تکرار خودکار روی یک کار دیتابیسی برداری انجام دهد و عملکرد را به ۱٫۵ برابر نسخه‌ی اولیه برساند.

مقاله رو دوست داشتی؟

نظرت چیه؟

تیم زومیت

نظرات