کنفرانس google I/O 2023

Google I/O یا Google AI؟ مسئله این است!

پنج‌شنبه ۲۱ اردیبهشت ۱۴۰۲ - ۱۶:۳۰
مطالعه 10 دقیقه
در کنفرانس Google I/O امسال، گوگل با تمرکزی فراتر از حد تصور بر هوش مصنوعی روی صحنه ظاهر شد تا عقب‌ماندگی‌اش از این حوزه جنجالی را جبران کند.
تبلیغات

در چند ماه گذشته، گوگل روزهای پرتلاطمی را در حوزه‌ی هوش مصنوعی تجربه کرد و به نظر می‌رسید رقابت را به مایکروسافت و جنجال تبلیغاتی‌اش بر سر چت‌جی‌پی‌تی باخته است. شرکتی که در ایجاد شبکه‌ی عصبی ترنسفورمر که مدل‌های زبانی بزرگ نظیر GPT برپایه‌ی آن توسعه یافته‌اند، نقش کلیدی داشت، حالا چنان از کارزار چت‌بات‌ها و دیگر ابزار هوش مصنوعی مولد عقب مانده بود که حتی عرضه‌ی بارد (Bard) هم نتوانست آن اعتباری را که مایکروسافت به‌راحتی با ChatGPT و بینگ چت به دست آورده بود، به گوگل بازگرداند.

از ماجرای خطای علمی و سرقت ادبی بارد بگیر تا استعفای جفری هینتون، پدرخوانده‌ی هوش مصنوعی، از گوگل پس از ۱۰ سال و هشدارش درباره‌ی خطرات این تکنولوژی؛ گوگل واقعا به تولدی دوباره در حوزه‌ای که بیشتر از هر شرکت دیگر در آن سرمایه‌گذاری کرده بود (نزدیک ۴ میلیارد دلار)، نیاز داشت. و چه فرصتی بهتر از کنفرانس Google I/O؟ کنفرانسی با چنان تمرکزی بر هوش مصنوعی که حتی محصولات سخت‌افزاری آن ازجمله گوشی‌ها و تبلت پیکسل هم از قابلیت‌های این تکنولوژی بی‌بهره نماندند.

شاید بهتر بود امسال نام Google I/O به Google AI تغییر می‌یافت. حقیقت این است که نمی‌توان دربرابر هیجان و پتانسیل وسوسه‌انگیز هوش مصنوعی مقاومت کرد و وقتی گوگل وعده می‌دهد تا این تکنولوژی را «برای همه به‌دردبخورتر و مفیدتر کند»، دلمان می‌خواهد حرفش را باور کنیم. اما آیا دنیا برای رویارویی با مدل‌های زبانی که با سرعتی برق‌آسا درحال پیشرفت هستند و هرلحظه باهوش‌تر از قبل می‌شوند، آماده است؟ یا به‌قول تریلر فیلم اوپنهایمر که درباره‌ی زندگی پدر بمب اتمی است، غول‌های فناوری دارند به انسان‌ها قدرت نابودی خودشان را می‌دهند و دنیا برای این تغییر آمادگی ندارد؟

باید منتظر ماند و دید.

کپی لینک

۱۰ اتفاق مهمی که در کنفرانس Google I/O 2023 افتاد

کپی لینک

۱- معرفی پیکسل فولد؛ تاشدنی گوگل با اندروید خالص و طراحی جذاب

پیکسل فولد گوگل در رنگ های مشکی و سفید

پیکسل فولد اولین پروژه‌ی گوگل در بازار گوشی‌های تاشدنی است که فرم‌فکتورش گوشی‌های سری گلکسی زد فولد سامسونگ را در ذهن تداعی می‌کند، اما از فولد ۴ باریک‌تر است.

مشخصات فنی گوشی تاشدنی Google Pixel Fold با برچسب قیمتی ۱٬۷۹۹ دلاری، این گوشی را به رقیبی جدید برای گلکسی زد فولد ۴ تبدیل کرده است؛ نمایشگر خارجی ۵٫۸ اینچی و نمایشگر داخلی ۷٫۶ اینچ، هر دو از نوع OLED با نرخ نوسازی ۱۲۰ هرتز با روشنایی حدود ۱۵۰۰ نیت. پردازنده‌ی Tensor G2 که پیش‌تر در پیکسل ۷ و پیکسل ۷ پرو دیده بودیم؛ ۱۲ گیگابایت رم با ۲۵۶ یا ۵۱۲ گیگابایت حافظه‌ی ذخیره‌سازی؛ باتری ۴٬۸۰۰ میلی‌آمپرساعتی با توان شارژ ۳۰ وات؛ مجهز به پنج دوربین ازجمله دوربین اصلی ۴۸ مگاپیکسلی، دوربین فوق عریض ۱۰٫۸ مگاپیکسلی و دوربین تله‌فوتوی ۱۰٫۸ مگاپیکسلی با بزرگ‌نمایی پنج برابری.

گوگل می‌گوید بیش‌از ۵۰ مورد از اپلیکیشن‌هایش را بهینه‌سازی کرده تا از مزایای نمایشگر داخلی بزرگ پیکسل فولد استفاده کنند. پیکسل فولد با اندروید ۱۳ از ماه آینده‌ی میلادی روانه‌ی بازار می‌شود و تا پنج سال به‌روزرسانی اندروید و به‌روزرسانی امنیتی را دریافت خواهد کرد.

کپی لینک

۲- معرفی پیکسل تبلت؛ تجربه‌ دلپذیر اندروید خالص در نمایشگر بزرگ‌تر

نمای جلو تبلت پیکسل گوگل روی داک اسپیکر شارژر
Google

پس از فرازونشیب‌های بسیار، گوگل سرانجام از تبلت پیکسل در رویداد I/O 2023 به‌همراه داک شارژی که آن را تبدیل به یک نمایشگر هوشمند خانگی می‌کند، رسماً رونمایی کرد.

تبلت پیکسل گوگل از همان تراشه‌ی تنسور G2 بهره می‌برد و طراحی‌اش ما را یاد پیکسل ۳ با آن لبه‌های گرد می‌اندازد. نمایشگر ۱۰٬۹۵ اینچی LCD این تبلت رزولوشن ۱۶۰۰ × ۲۵۶۰ و حداکثر روشنایی ۵۰۰ نیت ارائه می‌دهد و با قلم‌های استایلوس‌ شرکت‌های دیگر سازگاری دارد.

تفاوت کلیدی تبلت پیکسل گوگل با سایر تبلت‌هایی که تاکنون روانه‌ی بازار کرده در این است که از این دستگاه می‌توان به‌عنوان Assistant Smart Display استفاده کرد و مدیریت بسیاری از کارهای محیطی به‌خصوص در خانه‌های هوشمند را به آن سپرد.

تبلت پیکسل با رم ۸ گیگابایتی و حافظه ذخیره‌سازی ۱۲۸ و ۲۵۶ گیگابایتی UFS 3.1 با برچسب قیمتی ۴۹۹ دلار و ۵۹۹ دلار، ۲۰ ژوئن (۳۰ خرداد ۱۴۰۲) عرضه خواهد شد.

کپی لینک

۳- معرفی پیکسل 7a؛ میان‌رده‌ گوگل با نمایشگر ۹۰ هرتزی و دوربین قدرتمند

پیکسل 7a

پیکسل 7a گوگل،‌ عضو ارزان‌قیمت‌ سری پیکسل ۷ با برچسب قیمتی ۴۹۹ دلار امسال از سال‌های قبل اندکی گران‌تر است، اما درعوض چند ویژگی بالارده نظیر نرخ نوسازی ۹۰ هرتز و پشتیبانی از شارژ بی‌سیم ارائه می‌دهد.

پیکسل 7a همچنین از دوربین‌های جدیدی بهره می‌برد؛ دوربین اصلی ۶۴ مگاپیکسلی با حسگری ۷۲ درصد بزرگ‌تر از نسل قبل و یک دوربین ۱۳ مگاپیکسلی اولتراواید همراه با دوربین سلفی ۱۳ مگاپیکسلی.

این گوشی ۶٫۱ اینچی هم از تراشه‌ی تنسور G2 استفاده می‌کند و از ۸ گیگابایت رم و ۱۲۸ گیگابایت حافظه‌ی ذخیره‌سازی بهره می‌برد.

کپی لینک

۴- معرفی مدل‌زبانی PaLM 2؛ از متخصص سوالات پزشکی تا امنیت سایبری

مدل زبانی palm 2

مدل زبانی PaLM 2 گل سرسبد رویداد متمرکز بر هوش مصنوعی Google I/O بود. مدلی که از قدرت استدلال و منطقش از قبل بیشتر شده، براساس داده‌های چندزبانه متشکل از بیش از ۱۰۰ زبان آموزش دیده و قرار است خانواده‌ای از محصولات با قابلیت‌های مختلف را دربرگیرد.

این سیستم در نسخه‌های مختلف برای کاربران و سازمان‌ها عرضه خواهد شد و از نظر حجم داده‌ای که براساس آن آموزش دیده، به‌ترتیب از کوچک‌ترین به بزرگ‌ترین، چهار نسخه‌ به‌نام‌های Gecko، Otter، Bison و Unicorn را شامل می‌شود.

برای مثال، یکی از نسخه‌های 2 PaLM به‌نام «Med-PaLM 2» صرفا براساس داده‌های پزشکی آموزش دیده و به‌گفته‌ی گوگل، می‌تواند به سوالات مشابه آنچه در آزمون دریافت مجوز پزشکی ایالات متحده (USMLE) دیده می‌شود، در حد «متخصص» پاسخ دهد.

نسخه‌ی دیگر 2 PaLM موسوم‌به «Sec-PaLM 2» نیز براساس داده‌های امنیت سایبری آموزش دیده و می‌تواند «رفتار اسکریپت‌های مخرب را توضیح دهد و به کاربران در شناسایی کدهای حاوی بدافزار کمک کند.»

سبک‌ترین نسخه‌ی PaLM 2 یعنی Gecko آنقدر کوچک است که می‌تواند روی گوشی‌های هوشمند اجرا شود و در هر ثانیه ۲۰ توکن، معادل حدودا ۱۶، ۱۷ کلمه را پردازش کند. این مدل اگرچه قابلیت‌های محدودتری از نسخه‌های بزرگ‌تر ارائه می‌دهد، چون به‌صورت محلی اجرا می‌شود، دغدغه‌های حریم شخصی کمتری به‌همراه دارد.

کپی لینک

۵- گوگل سرانجام چت‌بات هوش مصنوعی را به موتور جستجو آورد

هوش مصنوعی در نتایج گوگل ۲

گوگل با وجود آنکه هم‌اکنون در حال توسعه‌ی چت‌بات بارد است، به‌اندازه‌ی رقبا، به چت‌بات‌ها علاقه‌‌ی چندانی ندارد و به تبدیل صفحه‌ی نتایج جست‌وجویش به چیزی شبیه به ChatGPT نیز تمایلی نشان نمی‌دهد، در عوض می‌خواهد AI را در دل نتایج جست‌وجو جای دهد؛ به‌این صورت که بالای نتایج سنتی، قسمت جدیدی به‌نمایش درمی‌آید که پاسخ AI به سؤال کاربر را به‌صورت خلاصه در دل خود دارد. سمت راست توضیحات AI سه لینک قرار خواهد گرفت که پاسخ تولیدشده را «تأیید می‌کنند».

گوگل پاسخ تولیدشده به‌دست هوش مصنوعی در موتور جست‌وجویش را AI snapshot می‌نامد؛ تمام پاسخ‌ها به‌کمک مدل‌های بزرگ زبانی خود گوگل و با استفاده از منابع موجود در اینترنت تولید می‌شوند.

صفحه‌ی نتایج گوگل نیز ظاهری جدیدی به‌خود گرفته؛ طرحی رنگارنگ و با محوریت هوش مصنوعی. در صفحه‌ی نتایج جدید به‌ویژه در نسخه‌ی موبایل، AI snapshot تقریبا کل صفحه‌ی اول را اشغال می‌کند. موتور جست‌وجوی گوگل اکنون از چند مدل بزرگ زبانی پیشرفته‌ی گوگل از جمله مدل چندمنظوره و جدید PaLM2 و Multitask Unified Model قدرت می‌گیرد.

در حال حاضر برای دسترسی به پاسخ‌های AI، باید در برنامه‌ای موسوم به Search Generative Experience عضویت داشته باشید. صف انتظار برای دسترسی به هوش مصنوعی مولد در Google Search از امروز در اپلیکیشن Google و صفحه‌ی Google.com روی مرورگر کروم آغاز می‌شود و نخستین کاربران آزمایشی طی هفته‌های آتی پذیرش خواهند شد.

کپی لینک

۶- Magic Editor؛ ویرایش حرفه‌ای تصاویر با هوش مصنوعی

ابزار هوش مصنوعی مجیک ادیتور گوگل

ابزار هوش مصنوعی Magic Editor که برای Google Photos معرفی شده، به‌کمک هوش مصنوعی مولد که نمونه‌ای از آن را در مولد تصویر Dall-E و Midjourney دیده‌ایم، ویرایش حرفه‌ای تصاویر را در حد فوتوشاپ برای کاربر انجام می‌دهد.

از دمویی که گوگل از توانایی‌های Magic Editor به نمایش گذاشت می‌توان گفت که این ابزار قابلیت‌های متعددی ازجمله جابه‌جایی سوژه‌ به نقطه‌ای بهتر در تصویر، تغییر اندازه‌ی سوژه، تغییر رنگ و میزان ابرها در آسمان یا پاک کردن موارد زاید از تصاویر را ارائه می‌دهد.

گوگل اعلام کرد Magic Editor اواخر سال میلادی جاری برای برخی از گوشی‌های پیکسل عرضه خواهد شد تا از فیدبک کاربران برای بهبود این ابزار استفاده کند.

کپی لینک

۷- اضافه شدن موقعیت‌یابی با نمایش واقع‌گرایانه و زنده مسیر به گوگل مپ

google maps /  گوگل مپ

گوگل سال گذشته با افزودن ویژگی Immersive View به گوگل مپ، شرایطی را مهیا کرد تا کاربران این اپلیکیشن بتوانند چشم‌اندازی از مقصد موردنظر خود کسب کنند. به‌زودی این ویژگی به مسیریابی روزانه اضافه خواهد شد تا کاربران جزئیات بیشتری را از مسیر پیش‌روی خود دریافت کنند.

ویژگی مذکور نه‌تنها می‌تواند مسیر حرکت را زیباتر جلوه دهد، بلکه می‌تواند با نمایش پرجزئیات‌ترِ مسیر، شِمایی کلی از جاذبه‌های گردشگری و دیگر بخش‌هایی که می‌تواند برایتان جذاب باشد را نمایش دهد. هدف اصلی Immersive View، نمایش جزئیاتی است که احتمالا در خلال یک سفر تفریحی برایتان مهم و کاربردی خواهد بود.

گوگل درنظر دارد تا Immersive View را تا آخر سال به بیش از ۱۵ شهر اضافه کند. این ویژگی با استفاده از هوش مصنوعی و توان محاسباتی عظیم کامپیوتری، میلیاردها تصاویر هوایی و تصاویر ثبت شده از طریق Street View را برای ساخت تصویری سه‌بعدی با یکدیگر ترکیب می‌کند.

کپی لینک

۸- انتشار عمومی گوگل بارد برای بیش‌از ۱۸۰ کشور همراه با پشتیبانی از زبان فارسی

زبان های جدید گوگل بارد

یکی از مهم‌ترین دلایلی که باعث شکست بارد از بینگ چت و چت‌جی‌پی‌تی می‌شد، محدودیت استفاده از آن و نبود پشتیبانی از زبان فارسی بود. گوگل در کنفرانس I/O 2023 اعلام کرد که کاربران بیش‌از ۱۸۰ کشور برای دسترسی به این چت‌بات دیگر نیازی به ثبت‌نام و قرارگرفتن در لیست انتظار ندارند. این چت‌بات تاکنون تنها برای کاربران ایالات متحده و بریتانیا دردسترس قرار داشت.

گوگل می‌گوید که بارد افزون‌بر انگلیسی، اکنون از زبان‌های کره‌ای و ژاپنی نیز پشتیبانی می‌کند و در آینده پشتیبانی از ۴۰ زبان برتر دنیا که خوشبختانه فارسی را نیز شامل می‌شود به آن اضافه می‌شود.

تغییر مدل زبانی بارد به PaLM 2 توانایی‌های این چت‌بات هوش مصنوعی را در زمینه‌ی استدلال، ریاضیات و مهارت‌های کدنویسی افزایش داده است. هم‌اکنون ۲۰ زبان برنامه‌نویسی پراستفاده توسط پایگاه داده این چت‌بات پشتیبانی می‌شود و کاربران می‌توانند برای اعمالی چون کدنویسی، دیباگ یا صادرکردن کد به پلتفرم‌های مختلفی چون Google Colab از بارد کمک بگیرند.

کپی لینک

۹- همکاری گوگل با ادوبی FireFly برای آوردن مولد تصویر به بارد

همکاری گوگل با ادوبی firefly

در رویداد Google I/O، اهالی مانتن‌ویو همکاری خود با ادوبی برای افزودن ویژگی‌های FireFly به چت‌بات Bard را اعلام کردند تا به‌ رقابت جدی با بینگ چت مجهز به مولد تصویر Dall-E بپردازند. کاربران می‌توانند با استفاده از این ویژگی مستقیما با استفاده از خط‌فرمان چت بات عکس‌های موردنظر خود را تولید و ویرایش کنند و با دیگر افراد به‌اشتراک بگذراند.

باتوجه به گزارش‌های منتشر شده، خروجی تصاویر تولید شده در Bard از همان کیفیتی برخوردارند که کاربران نسخه بتا FireFly تجربه کرده بودند؛ چراکه سرویس FireFly به منبع تصاویر باکیفیت Adobe Stock متصل است و کاربران می‌توانند تمامی محتواهای تولید شده را آزادانه با دیگران به‌اشتراک بگذارند.

امکان استفاده از FireFly در هفته‌های آینده دراختیار کاربران Bard قرار خواهد گرفت.

کپی لینک

۱۰- اضافه شدن ابزار هوش مصنوعی مولد به Workspace

گوگل Slides

گوگل قرار است تحت عنوان Duet AI for Workspace، تمام اپلیکیشن‌های Workspace ازجمله داکس، شیتس و اسلایدز را به هوش مصنوعی مولد مجهز کند.

کاربران می‌توانند از Duet AI برای نوشتن شرح شغل، داستان‌های خلاقانه یا تولید خودکار صفحات گسترده برای مدیریت داده‌ها استفاده کنند. این ابزار همچنین می‌تواند پاورپوینت‌های کامل ایجاد کند، برای اسلایدها متن پیشنهاد دهد یا بلافاصله عناصر بصری سفارشی تولید کند.

به‌نظر می‌رسد Duet AI پاسخ گوگل به 365 Copilot مایکروسافت باشد که از برخی از ابزارهای مولد این شرکت برای خلاقانه‌تر و کاربردی‌تر کردن نرم افزار آفیس استفاده می کند.

به‌روزرسانی‌های مبتنی بر هوش مصنوعی گوگل برای مجموعه نرم‌افزاری رایگان این شرکت به‌زودی در دسترس مصرف‌کنندگان قرار خواهد گرفت.

نظر شما درباره‌ی عملکرد گوگل در کنفرانس I/O امسال چیست؟ به‌ نظرتان سیر تحول تکنولوژی هوش مصنوعی در دستان غول‌های فناوری دارد دنیا را به جای بهتری هدایت می‌کند یا آخرالزمان ربات‌ها در پیش است؟

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات