گوگل با رونمایی Gemini عصر جدید هوش مصنوعی را آغاز کرد

چهارشنبه ۱۵ آذر ۱۴۰۲ - ۱۸:۴۸
مطالعه 4 دقیقه
هوش مصنوعی گوگل جمنای / Google Gemini طرح گرافیکی آبی و مشکی
مدل زبانی بزرگ Gemini که برای رقابت‌با GPT-4 ساخته شده است، عصر جدیدی را برای هوش مصنوعی گوگل رقم می‌زند.
تبلیغات

گوگل پس از شایعه‌های فراوان سرانجام بزرگ‌ترین مدل زبانی خود را با نام جمنای (Gemini) رونمایی کرد. این مدل به حدی برای گوگل اهمیت دارد که سوندار پیچای، مدیرعامل، آن را آغاز عصر جدید هوش مصنوعی در این شرکت می‌داند. به روایت پیچای، ازاین‌پس شاهد «عصر جمنای» هستیم.

مدل زبانی بزرگ جمنای نخستین‌بار در مراسم I/O 2023 گوگل مورد اشاره قرار گرفته بود و حالا به‌صورت عمومی قابل دسترس است.

گوگل می‌گوید جمنای جهش روبه‌جلوی بزرگی برای این شرکت محسوب می‌شود و در نهایت روی تمامی سرویس‌هایی که غول آمریکایی صنعت فناوری ارائه می‌دهد، اثر خواهد گذاشت.

جمنای صرفا در یک نسخه ارائه نمی‌شود. گوگل نسخه‌ی سبک‌تر این مدل زبانی بزرگ را با نام Gemini Nano معرفی کرده است که به‌صورت بومی و آفلاین روی دستگاه‌های اندرویدی اجرا خواهد شد.

مدل دوم که Gemini Pro نام دارد، به‌زودی وارد بسیاری از سرویس‌های هوش مصنوعی گوگل می‌شود. چت‌بات گوگل بارد ازاین‌پس به مدل زبانی بزرگ Gemini Pro مجهز است.

گوگل نسخه‌ی پیشرفته‌تری از هوش مصنوعی جمنای را با نام Gemini Ultra معرفی کرده است که قدرتمندترین مدل زبانی بزرگ این شرکت محسوب می‌شود و ظاهرا برای دیتاسنترها و پرداز‌ش‌های سازمانی توسعه داده شده.

تمام نسخه های هوش مصنوعی گوگل جمنای / Google Gemini

گوگل فعلا قصد دارد به چند شیوه از هوش مصنوعی جمنای استفاده کند: چت‌بات بارد به Gemini Pro مجهز شده است و کاربران گوشی گوگل مدل پیکسل ۸ پرو به‌لطف Gemini Nano به یک‌سری قابلیت جدید بر پایه‌ی هوش مصنوعی دست پیدا می‌کنند. مدل زبانی Gemini Ultra در سال ۲۰۲۴ از راه خواهد رسید.

هوش مصنوعی Gemini توانست در ۳۰ آزمون از مجموع ۳۲ آزمون، GPT-4 را شکست دهد

بر اساس بیانیه‌ی مطبوعاتی گوگل، توسعه‌دهندگان و سازمان‌ها می‌توانند در تاریخ ۱۳ دسامبر ۲۰۲۳ (۲۲ آذر ۱۴۰۲) ازطریق Google Generative AI Studio یا Vertex AI در سرویس گوگل کلاد به هوش مصنوعی Gemini Pro دسترسی پیدا کنند. Gemini فعلا فقط به زبان انگلیسی ارائه می‌شود، اما در آینده شاهد اضافه‌شدن زبان‌های بیشتر به این مدل زبانی بزرگ خواهیم بود.

سوندار پیچای می‌گوید هوش مصنوعی جمنای در نهایت با موتور جست‌و‌جوی گوگل، سرویس‌های تبلیغاتی، مرورگر کروم و سایر محصولات ادغام می‌شود. جمنای عملا آینده‌ی گوگل است.

شرکت OpenAI چت‌بات ChatGPT را یک سال و یک هفته قبل منتشر کرد و این سرویس آنلاین در زمانی کوتاه به محبوبیت قابل‌ توجهی دست یافت. حالا گوگل -که خودش را یکی از پیشگامان حوزه‌ی هوش مصنوعی می‌داند- سرانجام آماده است تا به جدی‌ترین شکل ممکن با OpenAI رقابت کند.

گوگل ۳۲ بنچمارک تخصصی هوش مصنوعی را روی جمنای و GPT-4 انجام داد تا این دو مدل زبانی بزرگ را که هم‌اکنون پرچمدارهای هوش مصنوعی محسوب می‌شوند، با یک‌دیگر مقایسه کند. به ادعای گوگل، جمنای در ۳۰ مورد از این آزمون‌ها قوی‌تر از GPT-4 عمل می‌کند تا دستاوردی عظیم برای غول آمریکایی ثبت شود.

به گفته‌ی مدیرعامل گوگل، ازاین‌پس شاهد «عصر جمنای» هستیم

در شماری از بنچمارک‌ها تفاوت بین جمنای و GPT-4 چندان چشمگیر نیست، اما در برخی دیگر از آن‌ها جمنای با تفاوت قابل توجه توانسته است جدیدترین مدل زبانی بزرگ OpenAI را پشت سر بگذارد.

بزرگ‌ترین پیروزی جمنای، در آزمون درک ویدیو و فایل‌های صوتی و همچنین تعامل با آن‌ها به دست آمده است. گوگل می‌گوید از همان آغاز توسعه‌ی جمنای، روی چندوجهی‌بودن این هوش مصنوعی تمرکز کرده است و این تلاش‌ها حالا نتیجه داده‌اند.

گوگل برخلاف OpenAI هوش مصنوعی جدیدش را بر پایه‌ی مدل‌های مختلف برای عکس و صدا تعلیم نداد بلکه تصمیم گرفت «یک مدل چندحسی» را از پایه توسعه دهد. مدیرعامل گوگل دیپ‌مایند، کسب‌و‌کار هوش مصنوعی گوگل، می‌گوید: «ما همیشه به سیستم‌های بسیار عمومی علاقه داشته‌ایم.»

لوگو هوش مصنوعی گوگل جمنای / Google Gemini

در حال حاضر نمونه‌های اولیه‌ی جمنای متن را درک می‌کنند و در پاسخ، متن می‌سازند؛ با این‌حال مدل‌های قدرتمندتر مثل جمنای اولترا می‌توانند همزمان با عکس و ویدیو و صدا نیز کار کنند. مدیرعامل گوگل دیپ‌مایند می‌گوید که جمنای در آینده «عمومی‌تر» خواهد شد. جمنای قرار است چیزهایی مثل لمس را نیز درک کند و دقیق‌تر و «آگاه‌تر» شود.

نباید فراموش کنیم که بنچمارک‌ها معیار کاملا دقیقی برای مقایسه‌ی مدل‌های زبانی بزرگ نیستند. مزایای جمنای نسبت‌به GPT-4 در نهایت توسط کاربرانی سنجیده می‌شود که به‌صورت روزمره از هوش مصنوعی برای انجام کارهای مختلف نظیر ایده‌پردازی، دریافت اطلاعات جدید و کدنویسی استفاده می‌کنند.

هوش مصنوعی جمنای به‌زودی با موتور جست‌و‌جوی گوگل و مرورگر کروم ادغام خواهد شد

گوگل معتقد است که جمنای در حوزه‌ی کدنویسی هیچ رقیبی ندارد. این مدل زبانی به سیستم کدنویسی جدیدی به نام AlphaCode 2 مجهز است که تا ۸۵ درصد بهتر از سرویس‌های رقیب عمل می‌کند و تا ۵۰ درصد بهتر از AlphaCode 1 شده است. سوندار پیچای می‌گوید کاربران جمنای در تمامی حوزه‌هایی که این مدل زبانی روی آن‌ها دست می‌گذارد، شاهد بهبود عملکرد خواهند بود.

ظاهرا بهره‌وری جمنای بسیار بیشتر از مدل‌های زبانی قبلی گوگل است. این هوش مصنوعی با استفاده از واحدهای پردازشی تنسور (Tensor) اختصاصی گوگل تعلیم داده شده است و نه‌تنها عملکرد سریع‌تری نسبت‌به PaLM دارد، بلکه نگهداری آن ارزان‌تر است.

گوگل در کنار جمنای نسخه‌ی جدید سیستم TPU را نیز رونمایی کرده است که TPU v5p نام دارد. این سیستم پردازشی در دیتاسنترها برای تعلیم مدل‌های هوش مصنوعی و اجرای مدل‌های زبانی بزرگ کاربرد خواهد داشت.

غول آمریکایی صنعت موتورهای جست‌و‌جو می‌گوید تلاش زیادی انجام داده است تا جمنای را ایمن بسازد. مدیرعامل گوگل دیپ‌مایند می‌گوید ایمنی در مدل‌های زبانی بزرگ نظیر جمنای اولترا اهمیت بسیار زیادی دارد و دقیقا به همین دلیل است که جمنای اولترا دیرتر از نسخه‌های دیگر منتشر می‌شود.

پیچای و سایر افراد حاضر در گوگل معتقدند که جمنای آغازگر پروژه‌ای عظیم است. وب، گوگل را به یکی از بزرگان صنعت فناوری تبدیل کرد. اثرگذاری جمنای بر گوگل احتمالا بیشتر از وب خواهد بود.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات