هوش مصنوعی جما ۴ رونمایی شد؛ کدنویس حرفهای گوگل با پیشرفتهای چشمگیر
گوگل هوش مصنوعی Gemma 4 را معرفی کرد؛ خانوادهای از مدلهای مختلف که با هدف افزایش تواناییهای پردازش محلی و بینیاز از سرویسهای ابری، طراحی شدهاند.
مدلهای جمنای گوگل پیشرفت چشمگیری داشتهاند؛ اما استفاده از آنها محدود به پلتفرم خودِ گوگل است. جما ۴ در چهار اندازهی مختلف، امکان اجرای این مدلها را روی سختافزارهای شخصی و متنوع فراهم میکند.
قدرتمندتر و دسترسپذیرتر
دو مدل بزرگتر جما ۴ با نام 26B Mixture of Experts و 31B Dense (بهترتیب ۲۶ و ۳۱ میلیارد پارامتر)، قادر به اجرا بدون کوانتیزهشدن در فرمت bfloat16 روی گرافیکهای H100 انویدیا با ظرفیت ۸۰ گیگابایت هستند. این کارت گرافیک قیمت بالایی دارد، اما همچنان امکان اجرای مدل را بهصورت محلی فراهم میکند. با کاهش دقت کوانتیزهشده، این مدلها حتی میتوانند روی GPU-های ارزانتر و گیمینگ نیز اجرا شوند.
گوگل بر کاهش تأخیر در پردازش جما ۴ تمرکز کرده تا از قابلیتهای پردازش آفلاین آن به بهترین شکل استفاده شود. مدل 26B Mixture of Experts تنها ۳٫۸ میلیارد پارامتر خود را در حالت استنتاج فعال میکند که باعث افزایش سرعت پردازش میشود. مدل 31B Dense بیشتر بر کیفیت تمرکز دارد؛ اما گوگل انتظار دارد توسعهدهندگان آن را برای کاربردهای خاص تنظیم کنند.
مدلهای جدید «نانو» برای گوشیها
دو مدل دیگر جما ۴ یعنی Effective 2B (E2B) و Effective 4B (E4B) که بهطور خاص برای موبایل طراحی شدهاند، روی حفظ مصرف پایین رم در حین استنتاج تمرکز دارند و قادر به اجرای ۲ یا ۴ میلیارد پارامتر مؤثر هستند.
جما ۴ توانایی بهبودیافتهای در زمینهی استدلال و ریاضیات دارد
تیم پیکسل گوگل با همکاری شرکتهای کوالکام و مدیاتک، این مدلها را برای دستگاههایی مانند گوشیهای هوشمند، Raspberry Pi و جتسون نانو بهینه کرده است. این مدلها نسبت به جما ۳، رم و انرژی کمتری مصرف میکنند و «تأخیر تقریباً صفر» دارند.
مدلهای جدید جما در مقایسه با جما ۳ عملکرد بهتری خواهند داشت. گوگل ادعا میکند که مدل ۳۱ میلیارد پارامتری در رتبهی سوم لیست Arena از بهترین مدلهای هوش مصنوعی متنباز قرار خواهد گرفت. با این حال، حتی بزرگترین مدل جما ۴، کوچکتر و البته ارزانتر از آن مدلها است.
جما ۴ بر اساس فناوری مشابه مدلهای بستهی جمنای ۳ گوگل ساخته شده است و قابلیتهای بهبودیافتهای در زمینههای استدلال، ریاضیات و پیروی از دستورالعملها ارائه میدهد. با توجه به تغییر رویکرد هوش مصنوعی به سمت مدیریت جریان کار، جما ۴ با پشتیبانی از فراخوانی تابع بومی، خروجی JSON ساختاریافته و دستورالعملهای بومی برای ابزارها و API-های رایج، برای این تغییر آماده است.
بهینگی برای کدنویسی
تولید کد بهعنوان یکی از کاربردهای اصلی هوش مصنوعی در حال ظهور است و گوگل میگوید جما ۴ برای همین زمینه بهینه شده. میتوان با استفاده از سیستمهای مختلف هوش مصنوعی کدهای قابل قبولی تولید کرد؛ اما مدلهای قوی مانند جمنای پرو و کلاود کد سرویسهای ابری هستند.
گوگل باور دارد که جما ۴ میتواند کیفیت کد مشابهی را در یک محیط آفلاین ارائه دهد؛ البته به شرطِ داشتن سختافزار مناسب برای اجرای مدلهای بزرگتر.
همهی قابلیتها در بیش از ۱۴۰ زبان مختلف پشتیبانی میشوند
گوگل میگوید جما ۴ در پردازش ورودی بصری بهتر عمل میکند و وظایفی مانند OCR و درک نمودارها را در سیستمهای محلی قابل اعتمادتر میکند. مدلهای کارآمد E2B و E4B از پشتیبانی بومی برای تشخیص گفتار برخوردار هستند که نسبتبه خانوادهی جما ۳ بهبود یافته است.
همهی قابلیتها در بیش از ۱۴۰ زبان مختلف پشتیبانی میشوند و هر مدلی میتواند حجم زیادی از کلمات را پردازش کند. حافظهی متنی برای مدلهای کوچک اکنون ۱۲۸ هزار توکن است و مدلهای ۲۶ و ۳۱ میلیارد پارامتری به ۲۵۶ هزار توکن دسترسی دارند (مدلهای جمنای ظرفیتی تا یک میلیون توکن ارائه میدهند).
تغییر در مجوز شاید مهمترین تغییر جما باشد. نسخههای قبلی با یک مجوز سفارشی همراه بودند که بسیاری از توسعهدهندگان آن را بیشازحد محدود میدانستند.
مجوز جما ۳ دارای سیاست استفادهی سختگیرانهای بود که گوگل میتوانست بهطور یکجانبه آن را بهروزرسانی کند و نیاز داشت تا توسعهدهندگان قوانین گوگل را در تمام پروژههای مبتنیبر جما اجرا کنند. حتی ممکن بود این مجوز به گونهای تفسیر شود که مجوز سایر مدلهای هوش مصنوعی ایجاد شده با اطلاعات جما را نیز منتقل کند. این موضوع باعث نگرانی بسیاری از توسعهدهندگان شد.
در مقابل، Apache 2.0 بسیار مجازتر است و هیچ شرایط استفادهی سختگیرانه یا محدودیت تجاری ندارد. توسعهدهندگان با Apache آشنا و راحت هستند و گوگل نمیتواند یکطرفه تصمیم بگیرد که مجوز به شکل دیگری کار کند.
گوگل معتقد است که دادن کنترل بیشتر به توسعهدهندگان برای اطلاعات و برنامههایشان، آنها را تشویق میکند تا از جما برای پروژههای بیشتری استفاده کنند و آنچه گوگل آن را «جماوِرس» مینامد را گسترش دهند.
انتشار E2B و E4B نشان میدهد که گوگل در تلاش برای توسعهی قابلیتهای هوش مصنوعی در گوشیهای هوشمند است. گوشیهای پیکسل و چند گوشی دیگر از مدلهای محلی به نام جمنای نانو استفاده میکنند که بر اساس جما 3n ساخته شده است.
هوش مصنوعی گوگل به این گوشیها امکان میدهد تا بدون ارسال اطلاعات به زیرساخت ابری و بینیاز از اینترنت، کلاهبرداریهای تلفنی و متنی را شناسایی کنند، یادداشتها را خلاصه کنند یا خلاصهای از تماسهای تلفنی ایجاد کنند.
گوگل میگوید نسل نانو ۴ از انواع مدلهای ۲ و ۴ میلیارد پارامتری بر اساس مدلهای Gemma 4 E2B و E4B خواهد بود.
گوگل از توسعهدهندگان دعوت میکند تا با استفاده از جدیدترین پیشنمایش Core Developer Preview با مدلهای E2B و E4B کار کنند. سیستمهایی که با مدلهای جدید طراحی شدهاند، هنگام انتشار جمنای نانو ۴ با آن سازگار خواهند بود.