گوگل از Gemma 4 12B رونمایی کرد؛ هوش مصنوعی پرقدرت آفلاین برای لپ‌تاپ‌ها

چهارشنبه 13 خرداد 1405 - 20:58
مطالعه 2 دقیقه
لوگو هوش مصنوعی جما گوگل / Google Gemma
گوگل نسخه‌ی جدید هوش مصنوعی جما را معرفی کرد؛ مدلی چندوجهی که قدرت پردازش سنگین را به لپ‌تاپ‌های معمولی با ۱۶ گیگابایت رم می‌آورد.
تبلیغات

دنیای هوش مصنوعی در حال تجربه‌ی یک تغییر مهم است؛ جایی که مدل‌های قدرتمند دیگر نیازی به ابرکامپیوترهای عظیم ندارند و می‌توانند مستقیماً روی سخت‌افزارهای شخصی اجرا شوند.

گوگل با معرفی مدل Gemma 4 12B، گامی بلند برای تحقق این هدف برداشت؛ مدلی که با هدف ارائه‌ی هوش مصنوعی چندوجهی و عامل‌محور (Agentic) برای لپ‌تاپ‌ها طراحی شده است و شکاف میان مدل‌های سبک و مدل‌های سنگین ۲۶ میلیارد پارامتری را پر می‌کند.

بر اساس بیانیه‌ی مطبوعاتی گوگل، جما ۴ به قابلیت‌های صوتی بومی مجهز شده است. این سرویس با معماری یکپارچه و بدون انکودر (Encoder-free)، ورودی‌های بصری و صوتی را مستقیماً به هسته‌ی اصلی مدل زبانی بزرگ (LLM) هدایت می‌کند و این امر منجر به کاهش چشمگیر تأخیر و مصرف حافظه می‌شود.

معماری نوآورانه و کارایی بالا

برخلاف مدل‌های سنتی که از انکودرهای جداگانه برای ترجمه‌ی تصاویر و صدا استفاده می‌کنند، گوگل در این مدل از یک رویکرد ساده‌‌شده بهره برده است.

در بخش بینایی، انکودرها با یک ماژول تعبیه‌ی (Embedding) سبک جایگزین شده‌اند و در بخش صوتی، سیگنال‌های خام مستقیماً به فضای توکن‌های متنی منتقل می‌شوند. این بهینه‌سازی باعث شده است تا Gemma 4 12B با وجود عملکردی نزدیک‌به مدل‌های ۲۶ میلیارد پارامتری، تنها با ۱۶ گیگابایت VRAM یا حافظه‌ی یکپارچه روی لپ‌تاپ‌های معمولی اجرا شود.

Gemma 4 12B با استفاده از قابلیت MTP، تأخیر در پاسخ‌دهی را به حداقل می‌رساند و تجربه‌ای روان از استدلال چندمرحله‌ای را ارائه می‌دهد.

دسترسی و توسعه

مدل جدید گوگل تحت مجوز Apache 2.0 منتشر شده و با اکوسیستم‌های توسعه‌دهنده کاملاً سازگار است. کاربران می‌توانند از طریق ابزارهایی مانند LM Studio و Ollama و LiteRT-LM به آن دسترسی پیدا کنند.

گوگل برای تسهیل توسعه‌ی عامل‌های هوشمند، مخزن رسمی Gemma Skills را منتشر کرده است. برای استقرار در مقیاس سازمانی نیز، امکان استفاده از Google Cloud و Cloud Run و GKE فراهم شده است تا توسعه‌دهندگان بتوانند مدل‌های خود را به سادگی به محیط عملیاتی منتقل کنند.

نظرات