هوش مصنوعی جمنای 1.5 با توانایی درک همزمان بیش‌از ۷۰۰ هزار کلمه رونمایی شد

پنج‌شنبه ۲۶ بهمن ۱۴۰۲ - ۱۹:۵۷
مطالعه 3 دقیقه
لوگو جمنای 1.5 گوگل / Google Gemini 1.5
گوگل با رونمایی جمنای ۱٫۵ قدم روبه‌جلو محکمی در حوزه‌ی هوش مصنوعی برداشت و نفس را در سینه‌ی OpenAI حبس کرد.
تبلیغات

تقریباً دو ماه پس از رونمایی جمنای، گوگل دست‌ به معرفی نسخه‌ی جدید این مدل زبانی بزرگ (LLM) زده است. غول آمریکایی صنعت فناوری می‌گوید جمنای ۱٫۵ از امروز برای توسعه‌دهندگان و کاربران سازمانی دردسترس است و به‌زودی برای کاربران عادی نیز منتشر می‌شود.

گوگل در بیانیه‌ی مطبوعاتی جدیدش به صراحت می‌گوید جمنای قرار است به تمرکز اصلی این شرکت در حوزه‌ی ابزارهای سازمانی و دستیارهای شخصی تبدیل شود.

جمنای ۱٫۵ پرو در ۸۷ درصد بنچمارک‌ها بسیار بهتر از جمنای ۱٫۰ پرو ظاهر شد

مدل زبانی بزرگ Gemini 1.5 بهبودهای پرشماری تجربه کرده است. نسخه‌ی پیشرفته‌ی این مدل زبانی با نام Gemini 1.5 Pro ظاهراً عملکرد هم‌سطح با Gemini Ultra دارد که به‌تازگی دردسترس قرار گرفته است. Gemini 1.5 Pro توانسته است در ۸۷ درصد از بنچمارک‌ها قوی‌تر از Gemini 1.0 Pro عمل کند.

گوگل می‌گوید جمنای ۱٫۵ پرو با بهره‌گیری از تکنیکی به نام MoE ساخته شده است تا هر زمان که سؤالی از آن می‌پرسید، صرفاً بخش‌هایی از کل مدل زبانی وارد عمل شوند و نیازی به درگیرکردن تمامی بخش‌ها نباشد. این رویکرد نه‌تنها باعث بهبود سرعت جمنای ۱٫۵ پرو می‌شود بلکه هزینه‌های نگهداری آن را برای گوگل کاهش می‌دهد.

یک ویژگی به‌خصوص درباره‌ی جمنای ۱٫۵ وجود دارد که کل شرکت گوگل ازجمله شخص سوندار پیچای (مدیرعامل) را بسیار هیجان‌زده کرده است. این مدل زبانی بزرگ Context Window بسیار عظیمی دارد؛ به بیانی بهتر، جمنای ۱٫۵ می‌تواند متن‌های بسیار طولانی‌تری را بفهمد و به دنبال اطلاعات بسیار بیشتری بگردد.

مقایسه توکن های جمنای 1.5 گوگل با رقبا

بر اساس گفته‌ی گوگل، Context Window جمنای ۱٫۵ به یک میلیون توکن رسیده؛ درحالی‌که همین عدد برای GPT-4 و Gemini Pro به ترتیب به ۱۲۸٬۰۰۰ توکن و ۳۲٬۰۰۰ توکن می‌رسد. فهم دقیق ماهیت توکن‌ها ساده نیست؛ به‌همین‌خاطر سوندار پیچای تلاش کرده است همه‌چیز را به سادگی توضیح دهد: «این معادل حدود ۱۰ تا ۱۱ ساعت فایل صوتی و ده‌ها هزار خط کد است.»

نکته‌ی هیجان‌انگیزتر این است که سوندار پیچای می‌گوید مهندسان گوگل در حال آزمایش Context Window جدیدی با ۱۰ میلیون توکن هستند؛ این یعنی عملاً می‌توان به اندازه‌ی کل قسمت‌های سریال Game of Thrones محتوا وارد هوش مصنوعی گوگل کرد.

مدیرعامل گوگل می‌گوید Context Window جمنای ۱٫۵ می‌تواند کل سه‌گانه‌ی ارباب حلقه‌ها را در خود جای دهد. او معتقد است که افزایش تعداد توکن‌های Context Window مزایای زیادی برای کسب‌و‌کارها خواهد داشت.

پیچای می‌گوید که فیلمسازان ممکن است کل فیلم خود را در جمنای آپلود کنند و از هوش مصنوعی بپرسند که منتقدان چه نظری خواهند داشت. به گفته‌ی پیچای، افزایش چشمگیر Context Window جمنای ۱٫۵ یکی از مهم‌ترین دستاوردهای تاریخ گوگل است.

بر اساس بیانیه‌ی گوگل، جمنای ۱٫۵ صرفاً ازطریق Vertex AI و AI Studio در دسترس کاربران تجاری و توسعه‌دهندگان است و در نهایت جایگزین جمنای ۱٫۰ می‌شود.

نسخه‌ی استاندارد جمنای پرو که هم‌اکنون ازطریق آدرس gemini.google.com قابل دسترس است، به جمنای ۱٫۵ پرو با Context Window جدید ۱۲۸٬۰۰۰ توکنی تبدیل خواهد شد. برای دسترسی به Context Window یک میلیونی باید اشتراک بخرید.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات