هوش مصنوعی جما ۴ رونمایی شد؛ کدنویس حرفه‌ای گوگل با پیشرفت‌های چشمگیر

یک‌شنبه 16 فروردین 1405 - 09:30
مطالعه 4 دقیقه
لوگو هوش مصنوعی جما ۴ گوگل در پس‌زمینه‌ی مشکی
گوگل هوش مصنوعی «جما ۴» را با پیشرفت چشمگیر در پردازش محلی و کدنویسی معرفی کرد.
تبلیغات

گوگل هوش مصنوعی Gemma 4 را معرفی کرد؛ خانواده‌ای از مدل‌های مختلف که با هدف افزایش توانایی‌های پردازش محلی و بی‌نیاز از سرویس‌های ابری، طراحی شده‌اند.

مدل‌های جمنای گوگل پیشرفت چشمگیری داشته‌اند؛ اما استفاده از آن‌ها محدود به پلتفرم خودِ گوگل است. جما ۴ در چهار اندازه‌ی مختلف، امکان اجرای این مدل‌ها را روی سخت‌افزارهای شخصی و متنوع فراهم می‌کند.

قدرتمندتر و دسترس‌پذیرتر

دو مدل بزرگ‌تر جما ۴ با نام 26B Mixture of Experts و 31B Dense (به‌ترتیب ۲۶ و ۳۱ میلیارد پارامتر)، قادر به اجرا بدون کوانتیزه‌شدن در فرمت bfloat16 روی گرافیک‌های H100 انویدیا با ظرفیت ۸۰ گیگابایت هستند. این کارت گرافیک قیمت بالایی دارد، اما همچنان امکان اجرای مدل را به‌صورت محلی فراهم می‌کند. با کاهش دقت کوانتیزه‌شده، این مدل‌ها حتی می‌توانند روی GPU-های ارزان‌تر و گیمینگ نیز اجرا شوند.

گوگل بر کاهش تأخیر در پردازش جما ۴ تمرکز کرده تا از قابلیت‌های پردازش آفلاین آن به بهترین شکل استفاده شود. مدل 26B Mixture of Experts تنها ۳٫۸ میلیارد پارامتر خود را در حالت استنتاج فعال می‌کند که باعث افزایش سرعت پردازش می‌شود. مدل 31B Dense بیشتر بر کیفیت تمرکز دارد؛ اما گوگل انتظار دارد توسعه‌دهندگان آن را برای کاربردهای خاص تنظیم کنند.

مدل‌های جدید «نانو» برای گوشی‌ها

دو مدل دیگر جما ۴ یعنی Effective 2B (E2B) و Effective 4B (E4B) که به‌طور خاص برای موبایل طراحی شده‌اند، روی حفظ مصرف پایین رم در حین استنتاج تمرکز دارند و قادر به اجرای ۲ یا ۴ میلیارد پارامتر مؤثر هستند.

جما ۴ توانایی بهبودیافته‌ای در زمینه‌ی استدلال و ریاضیات دارد

تیم پیکسل گوگل با همکاری شرکت‌های کوالکام و مدیاتک، این مدل‌ها را برای دستگاه‌هایی مانند گوشی‌های هوشمند، Raspberry Pi و جتسون نانو بهینه کرده است. این مدل‌ها نسبت به جما ۳، رم و انرژی کمتری مصرف می‌کنند و «تأخیر تقریباً صفر» دارند.

مدل‌های جدید جما در مقایسه با جما ۳ عملکرد بهتری خواهند داشت. گوگل ادعا می‌کند که مدل ۳۱ میلیارد پارامتری در رتبه‌ی سوم لیست Arena از بهترین مدل‌های هوش مصنوعی متن‌باز قرار خواهد گرفت. با این حال، حتی بزرگ‌ترین مدل جما ۴، کوچک‌تر و البته ارزان‌تر از آن مدل‌ها است.

جما ۴ بر اساس فناوری مشابه مدل‌های بسته‌ی جمنای ۳ گوگل ساخته شده است و قابلیت‌های بهبودیافته‌ای در زمینه‌های استدلال، ریاضیات و پیروی از دستورالعمل‌ها ارائه می‌دهد. با توجه به تغییر رویکرد هوش مصنوعی به سمت مدیریت جریان کار، جما ۴ با پشتیبانی از فراخوانی تابع بومی، خروجی JSON ساختاریافته و دستورالعمل‌های بومی برای ابزارها و API-های رایج، برای این تغییر آماده است.

بهینگی برای کدنویسی

تولید کد به‌عنوان یکی از کاربردهای اصلی هوش مصنوعی در حال ظهور است و گوگل می‌گوید جما ۴ برای همین زمینه بهینه شده. می‌توان با استفاده از سیستم‌های مختلف هوش مصنوعی کدهای قابل قبولی تولید کرد؛ اما مدل‌های قوی مانند جمنای پرو و کلاود کد سرویس‌های ابری هستند.

گوگل باور دارد که جما ۴ می‌تواند کیفیت کد مشابهی را در یک محیط آفلاین ارائه دهد؛ البته به شرطِ داشتن سخت‌افزار مناسب برای اجرای مدل‌های بزرگ‌تر.

همه‌ی قابلیت‌ها در بیش از ۱۴۰ زبان مختلف پشتیبانی می‌شوند

گوگل می‌گوید جما ۴ در پردازش ورودی بصری بهتر عمل می‌کند و وظایفی مانند OCR و درک نمودارها را در سیستم‌های محلی قابل اعتمادتر می‌کند. مدل‌های کارآمد E2B و E4B از پشتیبانی بومی برای تشخیص گفتار برخوردار هستند که نسبت‌به خانواده‌ی جما ۳ بهبود یافته است.

همه‌ی قابلیت‌ها در بیش از ۱۴۰ زبان مختلف پشتیبانی می‌شوند و هر مدلی می‌تواند حجم زیادی از کلمات را پردازش کند. حافظه‌ی متنی برای مدل‌های کوچک اکنون ۱۲۸ هزار توکن است و مدل‌های ۲۶ و ۳۱ میلیارد پارامتری به ۲۵۶ هزار توکن دسترسی دارند (مدل‌های جمنای ظرفیتی تا یک میلیون توکن ارائه می‌دهند).

تغییر در مجوز شاید مهم‌ترین تغییر جما باشد. نسخه‌های قبلی با یک مجوز سفارشی همراه بودند که بسیاری از توسعه‌دهندگان آن را بیش‌ازحد محدود می‌دانستند.

مجوز جما ۳ دارای سیاست استفاده‌ی سختگیرانه‌ای بود که گوگل می‌توانست به‌طور یکجانبه آن را به‌روزرسانی کند و نیاز داشت تا توسعه‌دهندگان قوانین گوگل را در تمام پروژه‌های مبتنی‌بر جما اجرا کنند. حتی ممکن بود این مجوز به گونه‌ای تفسیر شود که مجوز سایر مدل‌های هوش مصنوعی ایجاد شده با اطلاعات جما را نیز منتقل کند. این موضوع باعث نگرانی بسیاری از توسعه‌دهندگان شد.

در مقابل، Apache 2.0 بسیار مجازتر است و هیچ شرایط استفاده‌ی سختگیرانه یا محدودیت تجاری ندارد. توسعه‌دهندگان با Apache آشنا و راحت هستند و گوگل نمی‌تواند یک‌طرفه تصمیم بگیرد که مجوز به شکل دیگری کار کند.

گوگل معتقد است که دادن کنترل بیشتر به توسعه‌دهندگان برای اطلاعات و برنامه‌هایشان، آن‌ها را تشویق می‌کند تا از جما برای پروژه‌های بیشتری استفاده کنند و آنچه گوگل آن را «جماوِرس» می‌نامد را گسترش دهند.

انتشار E2B و E4B نشان می‌دهد که گوگل در تلاش برای توسعه‌ی قابلیت‌های هوش مصنوعی در گوشی‌های هوشمند است. گوشی‌های پیکسل و چند گوشی دیگر از مدل‌های محلی به نام جمنای نانو استفاده می‌کنند که بر اساس جما 3n ساخته شده است.

هوش مصنوعی گوگل به این گوشی‌ها امکان می‌دهد تا بدون ارسال اطلاعات به زیرساخت ابری و بی‌نیاز از اینترنت، کلاهبرداری‌های تلفنی و متنی را شناسایی کنند، یادداشت‌ها را خلاصه کنند یا خلاصه‌ای از تماس‌های تلفنی ایجاد کنند.

گوگل می‌گوید نسل نانو ۴ از انواع مدل‌های ۲ و ۴ میلیارد پارامتری بر اساس مدل‌های Gemma 4 E2B و E4B خواهد بود.

گوگل از توسعه‌دهندگان دعوت می‌کند تا با استفاده از جدیدترین پیش‌نمایش Core Developer Preview با مدل‌های E2B و E4B کار کنند. سیستم‌هایی که با مدل‌های جدید طراحی شده‌اند، هنگام انتشار جمنای نانو ۴ با آن سازگار خواهند بود.

نظرات