گوگل از Gemma 4 12B رونمایی کرد؛ هوش مصنوعی پرقدرت آفلاین برای لپتاپها
دنیای هوش مصنوعی در حال تجربهی یک تغییر مهم است؛ جایی که مدلهای قدرتمند دیگر نیازی به ابرکامپیوترهای عظیم ندارند و میتوانند مستقیماً روی سختافزارهای شخصی اجرا شوند.
گوگل با معرفی مدل Gemma 4 12B، گامی بلند برای تحقق این هدف برداشت؛ مدلی که با هدف ارائهی هوش مصنوعی چندوجهی و عاملمحور (Agentic) برای لپتاپها طراحی شده است و شکاف میان مدلهای سبک و مدلهای سنگین ۲۶ میلیارد پارامتری را پر میکند.
بر اساس بیانیهی مطبوعاتی گوگل، جما ۴ به قابلیتهای صوتی بومی مجهز شده است. این سرویس با معماری یکپارچه و بدون انکودر (Encoder-free)، ورودیهای بصری و صوتی را مستقیماً به هستهی اصلی مدل زبانی بزرگ (LLM) هدایت میکند و این امر منجر به کاهش چشمگیر تأخیر و مصرف حافظه میشود.
معماری نوآورانه و کارایی بالا
برخلاف مدلهای سنتی که از انکودرهای جداگانه برای ترجمهی تصاویر و صدا استفاده میکنند، گوگل در این مدل از یک رویکرد سادهشده بهره برده است.
در بخش بینایی، انکودرها با یک ماژول تعبیهی (Embedding) سبک جایگزین شدهاند و در بخش صوتی، سیگنالهای خام مستقیماً به فضای توکنهای متنی منتقل میشوند. این بهینهسازی باعث شده است تا Gemma 4 12B با وجود عملکردی نزدیکبه مدلهای ۲۶ میلیارد پارامتری، تنها با ۱۶ گیگابایت VRAM یا حافظهی یکپارچه روی لپتاپهای معمولی اجرا شود.
Gemma 4 12B با استفاده از قابلیت MTP، تأخیر در پاسخدهی را به حداقل میرساند و تجربهای روان از استدلال چندمرحلهای را ارائه میدهد.
دسترسی و توسعه
مدل جدید گوگل تحت مجوز Apache 2.0 منتشر شده و با اکوسیستمهای توسعهدهنده کاملاً سازگار است. کاربران میتوانند از طریق ابزارهایی مانند LM Studio و Ollama و LiteRT-LM به آن دسترسی پیدا کنند.
گوگل برای تسهیل توسعهی عاملهای هوشمند، مخزن رسمی Gemma Skills را منتشر کرده است. برای استقرار در مقیاس سازمانی نیز، امکان استفاده از Google Cloud و Cloud Run و GKE فراهم شده است تا توسعهدهندگان بتوانند مدلهای خود را به سادگی به محیط عملیاتی منتقل کنند.