چگونه گوگل درصدد گسترش استفاده از سیستم هوش مصنوعی خود همچون اندروید است؟

پنج‌شنبه ۵ آذر ۱۳۹۴ - ۲۳:۰۰
مطالعه 22 دقیقه
در نوامبر ۲۰۰۷ گوگل فعالیت خود در عرصه‌ی گوشی‌های هوشمند را با عرضه‌ی سیستم‌عامل متن‌باز اندروید آغاز کرد. هدف از عرضه‌ی این سیستم‌عامل در اختیار گرفتن بخش عمده‌ای از بازار بود که امروز با گذشت هشت سال از انتشار این پلتفرم، اندروید با در اختیار داشتن ۸۰ درصد از بازار موبایل، غول جستجو را به هدفش رسانده است. حال گوگل از همین حربه در حوزه‌ی هوش مصنوعی استفاده کرده و سعی دارد تا در فناوری‌های هوشمند نیز به یکه‌تاز بازار تبدیل شود. با زومیت همراه باشید تا نگاهی به فعالیت‌های گوگل در این حوزه داشته باشیم.
تبلیغات

هوش مصنوعی و فناوری‌های جدید هوشمند برای محاسبات از جمله‌ی حوزه‌هایی است که کمپانی‌های پیشرو در دره‌ی سیلیکون، فعالیت‌های گسترده‌ای را در این حوزه انجام می‌دهند. گوگل نیز از این قاعده مستثنی نبوده و در همین راستا در هفته‌ای که گذشت، پلتفرم TensorFlow را که مبتنی بر یادگیری ماشین است، بصورت متن‌باز در اختیار تمام علاقمندان به کار با این پلتفرم قرار داد. از این پس هر کاربر علاقمندی که به اتصال اینترنت و رایانه‌ دسترسی داشته باشد می‌تواند از وجود یک سیستم بسیار قوی که از الگوریتم‌های متعدد یادگیری ماشین بهره‌مند است،  به راحتی استفاده کند. گوگل برای تقویت بیش از پیش این سیستم و همچنین استفاده از امکانات و قابلیت‌های آن که روز به روز بر آن‌ها اضافه خواهد شد، بیش از ۵۰ سرویس خود را مبتنی بر این سیستم قرار داده است. یادگیری ماشین از شبکه‌های عصبی عمیق استفاده می‌کنند. این سیستم هم اکنون در کابردهای مختلفی برای گوگل انجام وظیفه می‌کنند که از جمله‌ی آن‌ها می‌توان به شناسایی تصاویر در سرویس Photos تا جستجوی اطلاعات در موتور جستجوی این کمپانی اشاره کرد. گوگل را دیگر باید یک کمپانی خواند که سرویس‌های خود را مبتنی بر یادگیری ماشین ارائه می‌کند. گوگل پس از توسعه‌ی سیستم یادگیری ماشین خود و استفاده‌ی عملی از آن در سرویس‌هایش، این سیستم را بصورت عمومی در اختیار علاقمندان قرار داده تا بیش از پیش به توسعه‌ی آن شتاب بخشند.

TensorFlow چیست؟ نگاهی به سیستم یادگیری ماشین گوگل که غول جستجو در پی همه گیر کردن آن است

تعریف ساده‌ی تانسورفلاو در درک داده‌های دریافتی و استفاده از آن‌ها در زمان تصمیم‌گیری است

 تانسورفلاو را باید کتابخانه‌ای از فایل‌ها خواند که این امکان را در اختیار محققان و دانشمندان در حوزه‌ی علوم کامپیوتر قرار می‌دهد تا سیستم‌هایی را برای تجزیه‌ و درک اطلاعات طراحی کنند. این سیستم‌ها قادرند با استفاده از کتابخانه‌ی موجود، داده‌هایی نظیر تصاویر و صدا را تجزیه کرده و آن‌ها را معنی کنند؛ این داده‌ها زمانی مورد استفاده قرار خواهند گرفت که رایانه بخواهد در زمینه‌ی خاصی تصمیم بگیرد. این تعریف چند خطی، تشریح ساده‌ای از عملکرد یک سیستم مبتنی بر یادگیری ماشین بود. در واقع اصل و بنیان یادگیری ماشین بر همین اصل استوار شده است: درک داده‌های دریافتی و استفاده از آن‌ها در زمان تصمیم‌گیری. یادگیری ماشین تلاشی است که در نتیجه‌ی آن رایانه‌ها هوشمندتر از پیش می‌شوند. در واقع هوشمندسازی رایانه‌ها تعریفی گسترده و غیرشفاف از مفهومی است که در مورد هوش مصنوعی می‌دانیم. تانسور فلاو نیز با توجه به قابلیت‌هایی نظیر دقت بالا و سرعت پردازش بالای اطلاعات، یک ابزار بسیار پیچیده به شمار می‌رود و به نوعی می‌توان آن را یکی از ابزارهای تعریف شده در حوزه‌ی هوش مصنوعی خواند.

در صورتی که بخواهیم کمی تخصصی‌تر به فرآیند پردازش اطلاعات در تانسورفلاو نگاه کنیم، باید این سیستم را مبتنی بر گراف‌های جریان داده تعریف کنیم. در این سیستم، داده‌ها از ابعاد مختلفی مورد بررسی قرار می‌‌گیرند. به بیان بهتر داده‌های وارد شده به سیستم از نظر داشتن مقادیر ارزشی گوناگونی در نظر گرفته شده و از چندین محاسبات ریاضی عبور می‌کنند. هر یک از این داده‌های چند بعدی تانسور خوانده شده و معادلات محاسباتی اعمال شده روی آن‌ها نیز به عنوان نودها در نظر گرفته می‌شوند. تغییرات داده‌ها بین نودهای مختلف، روابط در این سیستم را نشان می‌دهد. با توجه به اینکه جریان گراف تانسورها رابطه و ماهیت سیستم‌ها را تعریف می‌کند، از این‌رو گوگل این سیستم را TensorFlaw نام گذاری کرده است.

زیر پوست تانسور فلاو، منافع بلند مدتی برای گوگل پیش‌بینی شده که در واقع گسترش حوزه‌ی فعالیت این سیستم و گسترش نفوذ گوگل در حوزه‌ی هوش مصنوعی است

متن‌باز کردن این سیستم امکان بهره‌گیری از قابلیت‌های یک سیستم بسیار پیشرفته را در اختیار محققان، دانشمندان و حتی افرادی که به تازگی فارغ التحصیل شده یا همچنان در حال تحصیل هستند، قرار می‌دهد. اما تاثیر اصلی این سیستم در پتانسیل آن برای استفاده توسط سایر کمپانی‌هایی که در زمینه‌ی هوش مصنوعی و سیستم‌های یادگیری ماشین فعالیت می‌کنند، نهفته است. به بیان بهتر تمام کمپانی‌های فعال در این حوزه که شامل استارت‌آپ‌های کوچک تا کمپانی‌های چند میلیارد دلاری می‌شوند، می‌توانند از این سیستم در جهت اهداف خود استفاده کنند. تانسور فلاو این قابلیت را در اختیار تمام کمپانی‌ها قرار می‌دهد تا از قابلیت‌های آن در جهت نیازهای کمپانی‌های مورد نظر استفاده شود که این اهداف حتی می‌تواند در جهت عکس منافع گوگل نیز باشد. اما زیر پوست این سیستم، منافع بلند مدتی برای گوگل پیش‌بینی شده که در واقع گسترش حوزه‌ی فعالیت سیستم تانسور فلاو و گسترش نفوذ گوگل در حوزه‌ی هوش مصنوعی است.

پروفسور کریستوفر مننیگ (Christopher Manning)، استاد دانشگاه استنفورد است که از سه ماه پیش شانس استفاده از تانسور فلاو را داشته است. وی به همراه دانشجویانش در سه ماه گذشته با این سیستم کار کرده‌اند. تنها پس از گذشت چند ماه از کار با این سیستم، منینگ تصمیم گرفت تا از این سیستم در برنامه‌ی درسی خود استفاده کند.

منینگ علاوه بر اندروید، پلتفرم تانسورفلاو را به سرویس جی‌میل گوگل نیز تشبیه کرده است. به اعتقاد وی، با وجود اینکه سرویس‌های ایمیل متعددی در اینترنت وجود دارد، اما بسیاری استفاده از این سرویس ایمیل را به موجب بهره‌گیری از رابط کاربری ساده و کابردهای گسترده‌ی آن در سرویس‌های مختلف،  ترجیح می‌دهند.

منینگ در این خصوص چنین اظهار نظر کرده است:

پیش از اینکه گوگل تانسور فلاو را بصورت متن‌باز در اختیار همگان قرار دهد، کتابخانه‌های مبتنی بر یادگیری ماشین دیگری نیز وجود داشتند. اما نکته‌ای که در مورد این کتابخانه‌ها وجود دارد، توسعه‌ی آن توسط حداکثر تعداد معدودی دانشگاه و چند متخصص یا دانشجویی است که روی آن کار کرده‌اند.

هرچند سیستم‌های دیگری نظیر Torch یا Theano وجود دارند که توسط گروه کوچکی از متخصصان بروز شده و روز به روز قدرتمندتر از پیش می‌شوند، اما نمی‌توان گستردگی و قابلیت‌های ارائه شده توسط این سیستم‌ها را با سرعت و قدرت آنچه که متخصصان گوگل توسعه داده‌اند، مقایسه کرد. منینگ به این موضوع اشاره می‌کند که تانسور فلاو را باید یک هدیه‌ی بسیار ارزشمند برای جامعه‌‌ای از متخصصان و کمپانی‌ها خواند که در این حوزه به فعالیت می‌پردازند. به گفته‌ی وی بهینه‌سازی شبکه‌های عصبی امری طاقت فرسا است؛ از این‌رو آنچه گوگل بصورت متن‌باز دراختیار همگان قرار داده، بسیار ارزشمند است.

هدف از توسعه‌ی تانسور فلاو، توسعه‌ی نظریه‌های متخصصین از سطح ایده و پیاده‌سازی این ایده‌ها در سطحی است که بتوان از آن‌ها به عنوان یک محصول استفاده کرد.

جف دین، از جمله‌ی دو مهندس رده‌ی بالا در گوگل است که بخش اعظمی از توسعه‌ی تانسور فلاو را بر عهده داشته‌اند. فرد دیگری که نقش پررنگی در توسعه‌ی این سیستم دارد، راجات مونگا است. جف دین در خصوص میزان تاثیرگذاری و استفاده از این سیستم در جامعه‌ی فعالین حوزه‌ی هوش مصنوعی و یادگیری ماشین، با احتیاط بیشتری سخن می‌گوید. وی به این نکته اشاره می‌کند که گوگل تانسور فلاو را در کاربردهایی که خود از آن استفاده می‌کند، بسیار کاربردی و مثمر ثمر یافته است، حال آنکه این سیستم، آزمایش واقعی خود را زمانی پس خواهد داد که عموم متخصصان در کاربردهای مختلف بتوانند قابلیت‌های آن را مورد استفاده قرار داده و تانسور فلاو را یک سیستم کاربردی بدانند. جف دین، هدف از توسعه‌ی تانسور فلاو را توسعه‌ی نظریه‌های متخصصین از سطح ایده و پیاده‌سازی آن‌ها در سطحی می‌خواند که بتوان از آن‌ها به عنوان یک محصول استفاده کرد.

دین در این خصوص چنین اظهار نظر کرده است:

ما در درجه‌ی اول امیدواریم تا شتاب تحقیقات و پیاده‌سازی سیستم‌ها در حوزه‌ی یادگیری ماشین را بیش از پیش افزایش دهیم. جامعه‌ی فعال در حوزه‌ی یادگیری ماشین از نظر ارائه‌ی ایده‌های کاربردی بسیار فعال هستند؛ اما فعالیت‌های انجام شده در مورد پیاده‌سازی و کدنویسی در این حوزه به اندازه‌ی ایده‌های ارائه شده خوب و کاربردی نیست.

هرچند متن‌باز کردن این سیستم توسط گوگل هدیه‌ی بسیار بزرگی است، اما ایده‌آل‌ترین سناریو برای این سیستم زمانی اتفاق می‌افتد که جامعه‌ی فعال در یادگیری ماشین نیز دستاوردهای خود را در این حوزه با دیگران و گوگل به اشتراک بگذارند.

تانسور فلاو را باید یک سیستم کامل برای محققان معرفی کرد؛ چراکه در پکیج ارائه شده توسط گوگل می‌توان هر ابزار و امکاناتی را به منظور تحقیقات در حوزه‌ی هوش مصنوعی یافت. تانسور فلاو یک سیستم کامل و در واقع یک کتابخانه‌ی مستقل است که با ابزار‌های کاربردی و گواهی آپاچی ۲.۰ نیز همراه شده است؛ از این‌رو می‌توان از این سیستم در کاربردهای تجاری نیز استفاده کرد. تانسور فلاو را می‌توان در رایانه‌ی رومیزی و لپ‌تاپ کامپایل کرده یا از آن روی گوشی‌های هوشمند اندرویدی استفاده کرد. گوگل این سیستم را همراه با مستندات و فایل‌های آموزشی متعددی همراه کرده تا کاربران بتوانند از آن استفاده کنند.

منینگ با اشاره به قابلیت اجرای الگوریتم‌های یادگیری ماشین روی گوشی‌های هوشمند اندرویدی، این ویژگی را برتری و وجه تمایز تانسور فلاو با سایر سیستم‌های مبتنی بر یادگیری ماشین متن‌باز عنوان کرده است.

برای افرادی که می‌خواهند ا زاین سیستم استفاده کنند، گوگل نسخه‌ای را تدارک دیده که می‌توان از آن بهره گرفت. همچنین API تانسور فلاو نیز در اختیار برنامه‌نویسان قرار دارد تا بتوانند با بهره‌گیری از آن مدل‌های خود را در تانسور فلاو کنترل و مدیریت کنند.همانطور که اشاره کردیم، گوگل در بیش از ۵۰ سرویس خود از این سیستم استفاده می‌کند.

در داخل آزمایشگاه هوش مصنوعی گوگل چه می‌گذرد؟

متن‌باز کردن این پلتفرم توسط گوگل به این معنا است که همه‌ی افراد فعال در این حوزه از شانس برابری برای بهره‌گیری از قابلیت‌های تانسور فلاو بهره می‌برند. در واقع با نگاهی به این پلتفرم می‌توان روند توسعه‌ و پیشرفت سرویس‌های گوگل مبتنی بر سیستم یادگیری ماشین را به روشنی دید.

گوگل در سه سال اخیر تمام زمان خود را برای ساخت این پلتفرم گسترده برای استفاده در حوزه‌ی هوش مصنوعی صرف کرده و هم اکنون شاهد عرضه‌ی جهانی و در اختیار گذاردن آن برای تمام علاقمندان و فعالان در این حوزه هستیم. البته باید به این نکته اشاره کرد که گوگل ترجیح می‌دهد تا این سیستم با عنوان هوش ماشین شناخته شود. گوگل استفاده از واژه‌ی هوش مصنوعی را به این دلیل که این واژه دربردارنده‌ی  مفاهیم کلی بسیاری است، مناسب سیستمی که توسعه داده نمی‌داند. این کمپانی در پی آن است تا یک هوش واقعی را ایجاد کند که این هوش درماشین‌ها مورد استفاده قرار خواهد گرفت.

 مهندسان گوگل در این کمپانی در صورتی که بخواهند تا با سیستم‌های مبتنی بر شبکه‌های عصبی کار کنند، می‌توانند این سیستم را به طور کامل برای استفاده در اپلیکیشن یا سرویس خود و به منظور همخوانی با اهداف تعیین شده برای سرویس مدنظرشان از نو بسازند. این سیستم به اندازه‌ای پویا است که ۱۰۰ تیم در داخل خود گوگل با استفاده از آن تکنیک‌های مبتنی بر یادگیری ماشین متفاوتی را توسعه داده‌اند.

ساندار پیچای، مدیرعامل گوگل در جریان کنفرانس مربوط به ارائه‌ی گزارش مالی گوگل در اکتبر ۲۰۱۵ در این رابطه چنین اظهار نظر کرده است:

یادگیری ماشین هسته‌ و مسیر انقلاب در سرویس‌های کنونی ما است که ما را به تجدید نظر در مورد کارکرد سیستم ها واداشته است. ما در حال اعمال و استفاده از این سیستم در کل محصولات و سرویس‌هایی که ارائه می‌دهیم، هستیم. برای مثال می‌توان به سرویس جستجو، یوتیوب و گوگل پلی اشاره کرد. ما هنوز در اول مسیر هستیم و به مرور و بصورت اصولی این سیستم بنیادی را در کل سرویس‌های خود به کار خواهیم بست.

در گوگل همه چیز مبتنی بر هوش مصنوعی بوده و هوش مصنوعی همه چیز است

به سختی می‌توان نموداری دقیق و روشن از میزان بکارگیری هوش ماشین در گوگل تعریف کرد؛ چراکه تحقیقات در این مورد بسیار گسترده بوده و این سیستم در گوگل همواره در حال تغییر است. همچنین باید به این نکته اشاره کرد که تیم‌های مختلف فعال در گوگل همگی به نوعی در این خصوص درگیر بوده و در حال استفاده از هوش ماشین در سرویس ارائه شده توسط گوگل هستند.

جان جیاناندرا، قائم مقام مهندسی اینترنت، سیستم در حال توسعه توسط گوگل را Embedded Model خوانده است. هرچند گوگل سیستم هوش ماشین خود را بصورت متن‌باز در اختیار همگان قرار داده، اما فرآیند توسعه‌ی سیستم مورد نظر در تیم‌های مختلف گوگل بصورت بسیار سری انجام شده و کوچک‌ترین اطلاعاتی در این خصوص به بیرون درز نمی‌کند.

در مقر اصلی گوگل که بیش از ۳۲۵٫۰۰۰ متر مربع وسعت دارد، تمام تیم‌ها برای استفاده از این سیستم هوش ماشین گوگل درگیر هستند

در مقر اصلی گوگل که بیش از ۳۲۵٫۰۰۰ متر مربع وسعت دارد، تمام تیم‌ها برای استفاده از این سیستم هوش ماشین گوگل درگیر هستند. هر یک از متخصصانی که در این کمپانی به فعالیت می‌پردازد از این سیستم در راستای اهداف تیمی که در آن عضو است، استفاده می‌کند. علاوه بر این افراد که هر یک در تیم‌های خود به توسعه‌ی سرویس‌های مورد نظر می‌پردازند، همواره متخصصانی نیز وجود دارند که وظیفه‌ی آن‌ها برطرف کردن مشکلات اصلی موجود در سیستم هوش ماشین توسعه داده شده توسط گوگل است. نتیجه‌ی این کار مستقیما روی عملکرد تمام سرویس‌های گوگل که از این سیستم هوشمند استفاده می کنند تاثیرگذار است. از جمله‌ی این اپلیکیشن‌های اصلی می‌توان به Photos یا جستجوی صوتی گوگل و مهم‌تر از همه جستجوی متنی گوگل اشاره کرد. البته در این بین شماری از پروژه‌ها نیز وجود دارند که محصولی برگرفته از آن تاکنون روانه‌ی بازار نشده است. برای مثال می‌توان به سیستم دست‌خط کاربران اشاره کرد.

جیاناندرا در این خصوص چنین اظهار نظر کرده است:

ما از جمله‌ی کمپانی‌هایی هستیم که دوست داریم بدانیم مردم با استفاده از چه الگویی می‌نویسند و هر شخص براساس چه معیارهایی دست خط خاصی دارد. همین موضوع از جمله‌ی حوزه‌هایی است که گوگل روی آن سرمایه‌گذاری می‌کند؛ هرچند تاکنون محصولی مستقل برگرفته از آن در اختیار کاربران قرار نگرفته است.

البته باید به این موضوع اشاره کرد که گستردگی اپلیکیشن‌ها و سرویس‌های ارائه شده توسط گوگل این امکان را فراهم می‌کند تا بالاخره هر یک از پروژه‌ها نهایتا در صورت عدم عرضه بصورت محصول مستقل، با اپلیکیشن یا سرویس دیگری عرضه شود. در مورد پروژه‌ی شناسایی دست خط نیز گوگل ترجیح داده تا از این ویژگی در سرویس Google Keep استفاده کند.

معمولا روال کار به این صورت است که با پایان کار تحقیقات و رسیدن به دستاوردهای تحقیقاتی در یک موضوع خاص، محققان یافته‌های خود را در اختیار تیم‌های توسعه قرار می‌دهند تا اعضای این تیم از فناوری‌های جدید در محصولات نهایی استفاده کنند. برای مثال می‌توان به اپلیکیشن Photos و سرویس ترجمه‌ی گوگل اشاره کرد.

در بخش تحقیقات نیز، گوگل افراد را براساس علایق به گروه‌های تحقیقاتی مختلفی تقسیم کرده است. برای مثال شماری از افراد در تیم تحقیقاتی بینایی ماشین، شماری در درک زبان‌ها و شمار دیگری نیز در تیم شناسایی صوت فعالیت می‌کنند. این تیم‌ها هر یک در حوزه‌های تعیین شده دستاوردهای جدید خود را در اختیار تیم‌های توسعه قرار می‌دهند که وظیفه‌ی آن‌ها طراحی و توسعه‌ی محصولات است.

جیاناندرا در مورد هدف گوگل از تیم‌‌های تحقیقاتی چنین اظهار نظر کرده است:

گوگل در زمینه‌هایی نظیر شناسایی صوت، ترجمه‌ی زبان‌ها و درک زبان‌های مختلف درصدد بهره‌گیری از بهترین سیستم‌های ممکن است؛ از این‌رو حوزه‌های مورد نظر را باید در زمره‌ی مواردی قرار داد که گوگل همواره روی آن‌ها سرمایه‌گذاری می‌کند.

در گوگل بیش از ۱۰۰۰ متخصص در مورد کاربردهای هوش ماشین مشغول به انجام تحقیقات هستند

در گوگل بیش از ۱۰۰۰ متخصص در مورد کاربردهای هوش ماشین مشغول به انجام تحقیقات هستند. فرآیند کار روی پروژه و دستاوردهایی که تیم به آن‌ها دست پیدا می‌کند، وضعیت را از کار کردن روی یک مفهوم نظری، به تلاش برای دست یافتن به یک کاربرد عملی و ارائه‌ی سرویس تبدیل می‌کند. البته میزان سختی پروژه‌هایی که توسط تیم‌های مختلف انجام می‌شود، متفاوت است.

تغییرات در گوگل و ایجاد هلدینگ آلفابت نیز نتوانسته مواضع غول جستجو را در مورد هوش ماشین را تغییر دهد. هر چند تیم تحقیقاتی که روی پروژه‌ی هوش ماشین کار می‌کند، همچنان زیر پرچم گوگل باقی می‌ماند، اما مانعی برای همکاری با سایر بخش‌های کمپانی نظیر آزمایشگاه گوگل ایکس یا بخش علوم وجود نخواهد داشت.

صدایی از آینده

جستجوی صوتی یکی از محصولات درخشان گوگل است که می‌توان به جرات آینده‌ی درخشانی را برای آن پیش‌بینی کرد.یقینا تاکنون بارها با سیستم جستجوی صوتی گوگل روبرو شده یا از آن استفاده کرده‌اید. در صورتی که آشنایی چندانی با سیستم جستجوی صوتی گوگل ندارید، بهتر است در صورت استفاده از سیستم جستجوی گوگل، نگاهی به منتهی الیه سمت راست کادر جستجو داشته باشید تا آیکن میکروفون مربوط به جستجوی صوتی را مشاهده کنید. با کلیک روی این آیکن میکروفون و فشار دادن آن می‌توان عبارت مورد نظر خود را که می‌خواهیم آن را جستحو کنیم، به زبان بیاوریم که در نتیجه گوگل با دریافت صدای شما و تلاش برای تفکیک و درک منظور، نتایج مرتبط را نمایش می‌دهد. آیکن میکروفون مورد نظر در اپلیکیشن‌ جستجوی گوگل برای اندروید و آیفون‌های اپل نیز قابل مشاهده است.

جستجوی صوتی گوگل به دومین مدخل برای دسترسی به مخزن داده‌های گوگل تبدیل شده است

هرچند می‌توان دستیار صوتی اپل یا همان سیری را به عنوان رقیبی برای سیستم صوتی گوگل در نظر گرفت، اما باید به این موضوع اشاره کرد که جستجوی صوتی گوگل به دومین مدخل برای دسترسی به مخزن داده‌های گوگل تبدیل شده است. تیم توسعه‌‌دهنده‌ی سیستم شناسایی زبان‌های گوگل از این موضوع بسیار خرسند است؛ چراکه جستجوی صوتی گوگل رفته رفته در حال افزایش محبوبیت خود بوده و پس از جستجوی متنی به دومین راه برای کند و کاو اطلاعات از طریق گوگل تبدیل شده است.

البته باید به این نکته اشاره کرد که گوگل در گزارش‌های خود اشاره‌ای به میزان جستجوهای انجام شده از طریق صوت نکرده است. البته این کمپانی به این موضوع اشاره کرد که میزان جستجوهای انجام شده با استفاده از گجت‌های موبایل نسبت به جستجوهای انجام شده از طریق رایانه‌های دسکتاپ بسیار افزایش یافته و کفه‌ی ترازو در آمریکا به سمت جستجوهای موبایل سنگین‌تر شده است. به همین نسبت در طول سال گذشته‌ی میلادی میزان جستجوهای صوتی انجام شده در آمریکا که از طریق تبلت و گوشی هوشمند انجام شده، نشان از افزایشی بیش از ۵۰ درصد دارد. یکی از چالش‌های پیش روی گوگل، آشنا کردن و ترغیب کاربران برای استفاده از سیستم جستجوی صوتی گوگل است.

فرانسیز بوفیز، محقق ارشد گوگل در زمینه‌ی توسعه‌ی موتور شناسایی صوت گوگل که در سیستم جستجوی این کمپانی مورد استفاده قرار می‌گیرد، فعالیت می‌کند. وی دلیل افزایش استفاده از سیستم صوتی جستجوی گوگل را بهبود عملکرد این سیستم در مقایسه با روزهای اول فعالیت این سیستم می‌داند. وی در این خصوص چنین اظهار نظر کرده است:

زمانی که ما فعالیت‌های خود را برای توسعه‌ی سیستم‌های شناسایی صوت آغاز کردیم، شماری از کاربران از این سیستم استفاده می‌کردند، اما در حالت کلی اغلب کاربران صبر کرده بودند تا پس از بهبود عملکرد این سیستم به سراغ آن بیایند. امروزه بخش بزرگی از کاربران به سیستم جستجوی صوتی گوگل اعتماد کرده و از آن استفاده می‌کنند.

بوفیز به این موضوع اشاره کرده که گوگل موتور قبلی مورد استفاده برای شناسایی اصوات را کنار گذاشته و از سیستم جدید مبتنی بر شبکه‌های عصبی برای شناسایی صدای کاربران و تشخیص دستورات صوتی استفاده می‌کند.

برای اینکه یک ماشین یا به بیان بهتر رایانه بتواند صدای انسان را درک کند، ابتدا نیاز است تا این سیستم ابتدا آوای کلمات و عبارات را یاد بگیرد. یادگیری صدای لغات و عبارات در هر زبان به معنای گوش دادن به حجم زیادی از فایل‌های صوتی است. تمام این فایل‌های صوتی یکبار توسط الگوریتم‌های خاصی مورد پردازش قرار می‌گیرند که نتیجه‌ی آن ایجاد گراف‌هایی است که طی آن مشخص می‌شود چه صدایی به کدام لغت یا عبارت نزدیک تر است. زمانی که یک فایل صوتی در اختیار سیستم قرار می‌گیرد، موتور مورد نظر شکل موج فایل صوتی دریافت شده را از گرافی که تشکیل داده عبور می‌دهد تا بتواند معنای عبارات مورد استفاده در فایل صوتی را درک کند.

بوفیز در مورد عملکرد گراف تشکیل شده این چنین اظهار نظر می‌کند:

زمانی که فایل صوتی دریافت شده توسط گراف مورد نظر بررسی شد، فایل صوتی مورد نظر در خروجی به رشته‌ای از لغات تبدیل می‌شود و سیستم این رشته را به عنوان خروجی عرضه می‌کند.

عملکرد سیستم شناسایی صدا به فایل‌های صوتی که در ابتدا برای آموزش سیستم مورد استفاده قرار می‌گیرند، وابسته است

باید به این نکته توجه کرد که عملکرد این سیستم به فایل‌های صوتی که در ابتدا برای آموزش سیستم مورد استفاده قرار می‌گیرند، وابسته است. این داده‌های صوتی شامل بیش از میلیون‌های فایل صوتی است که توسط کاربران گوگل در زمان جستجوی از طریق صدا وارد سیستم شده است. زمانی که هر کاربر اقدام به انجام یک جستجوی صوتی می‌کند، صدای ضبط شده در سرور‌های گوگل آپلود می‌شود. در صورتی که اجازه از سوی کاربر برای بهره‌گیری از این صدا صادر شده باشد، عول جستجو از این فایل صوتی در بانک اطلاعاتی فایل‌های صوتی خود استفاده می‌کند تا هوش ماشین خود را آموزش داده و تقویت کند.

پیش از آنکه این فایل صوتی توسط سیستم مورد استفاده قرار گیرد، باید مراحلی طی شود. ابتدا تمام اطلاعاتی که از شما روی این فایل صوتی باقی مانده، پاکسازی می‌شود، به بیان بهتر تمام اطلاعاتی که فایل صوتی را به کاربر متصل می‌کند، از آن پاک می‌شود. این اطلاعات می‌تواند شامل اطلاعات مکانی، اطلاعات حساب کاربری و حتی زمان وارد شدن صدا در سیستم باشد که به نوعی با کنار هم قرار دادن آن کاربر شناسایی می‌شود. این فایل صوتی در مرحله‌ی بعد در اختیار یک عامل انسانی قرار می‌گیرد تا فایل صوتی مورد نظر را گوش کرده، اطلاعات مربوط به آن را بصورت متنی استخراج  و آن را به تفکیک لغات و در قالب جمله‌ای که کاربر وارد سیستم کرده، بنویسد. علت اینکه در این مرحله از یک عامل انسانی استفاده شده، نیاز به یک منبع معتمد است تا اطلاعات را به درستی برای آموزش در اختیار سیستم قرار دهد. هر یک از فایل‌های صوتی وارد شده در سیستم باید یک متادیتا داشته باشند. یک فایل صوتی نامناسب نمونه‌ای است که متادیتای مناسبی با آن همراه نشده باشد. در برخی موارد محققان به عمد نویزهایی را روی برخی فایل‌های صوتی قرار می‌دهند تا از این طریق سیستم قادر باشد لغات مختلف را در شرایط متفاوتی که کیفیت فایل صوتی برابر نیست، شناسایی کند.

بوفیز روی این نکته تاکید می‌کند که شرکت در این آزمایش کاملا اختیاری است و کاربرانی که تمایلی به نگهداری و استفاده از صدای آن‌ها در سیستم نداشته باشند، می‌توانند از این کار جلوگیری کنند.

دو سال پیش نرخ خطای سیستم تشخیص صدا بیش از ۲۵ درصد بود؛ حال آنکه خطای سیستم در حال حاضر به کمتر از ۸ درصد رسیده است.

براساس اطلاعات ارائه شده توسط گوگل، استفاده از این سیستم باعث شده تا میزان خطا در سیستم شناسایی صدای کاربران کاهش بسیار زیادی را تجربه کند. اطلاعات ارائه شده نشان از این دارد که دو سال پیش نرخ خطای سیستم بیش از ۲۵ درصد بود؛ حال آنکه خطای سیستم در حال حاضر به کمتر از ۸ درصد رسیده است.

اما سوالی که شاید به ذهن شما رسیده، روشی است که گوگل در صورت عدم امکان دسترسی به داده‌های کاربران برای آموزش سیستم مورد استفاده قرار خواهد داد؟

اینباکس هوشمند

همانطور که در زومیت خواندید، گوگل در هفته‌های اخیر سیستم هوشمند خود را با سرویس ایمیل خود و اپلیکیشن اینباکس ترکیب کرده است. در صورتی که از اپلیکیشن اینباکس روی گوشی‌هوشمند یا تبلت خود استفاده کنید، عملکرد سیستم تانسور فلاو را مشاهده خواهید کرد. براساس اطلاعات ارائه شده، قابلیت جدید این امکان را در اختیار کاربران قرار می‌دهد تا در صورتی که فرصت کافی برای پاسخ گویی به ایمیل نداشته باشند، از پاسخ‌های پیشنهادی سیستم استفاده کنند. در این حالت سیستم هوشمند با مطالعه‌ی متن ایمیل کاربر سه پاسخ را به وی نمایش خواهد داد تا برای فرستنده‌ی ایمیل ارسال کند. در صورتی که یکی از پاسخ‌ها به دفعات از سوی کاربر مورد استفاده قرار نگیرد، سیستم هوشمند گوگل به این نتیجه خواهد رسید که کاربر علاقه‌ای به پاسخ مورد نظر نداشته و از آن پس این پاسخ را پیشنهاد نخواهد داد. گوگل این ویژگی جدید در اینباکس را با نام Smart Reply معرفی کرده است.

آلکس گاولی، مدیر محصول جیمیل در مورد این قابلیت چنین اظهار نظر کرده است:

ما به مرور قدرت شبکه‌های عصبی توسعه یافته توسط تیم‌ تحقیقاتی گوگل را مشاهده کردیم. مشاهده ی قابلیت‌های این سیستم هوشمند ما را بر آن داشت تا از این قابلیت‌ها در مواردی بیش از درک و سازمان‌دهی استفاده کنیم. ایده‌ی استفاده از این سیستم برای درک و نگارش پاسخ برای ایمیل‌ها از همین موضوع نشات گرفته است.

 متخصصان گوگل به این موضوع اشاره می‌کنند که هیچ یک از ایمیل‌ها توسط افراد در گوگل خوانده نمی‌شوند و همه‌ی فرآیند بر عهده‌ی سیستم است. همچنین سیستم براساس انتخاب کاربر در مورد استفاده از داده‌ها به منظور یادگیری، از متن ایمیل برای آموزش شبکه‌ی عصبی استفاده می‌کند. براساس داده‌های وارد شده و آموزش سیستم، متخصصان بدون نیاز به خواندن ایمیل‌های کاربران سوالاتی را از سیستم می‌پرسند و براساس پاسخ‌های دریافت شده به این نتیجه می‌رسند که کدام قسمت از سیستم نیاز به بهبود دارد.

با نگاهی به اسمارت ریپلای می‌توان به وضوح دید که گوگل چگونه این سیستم را در محصولات خود مورد استفاده قرار می‌دهد. تیم اینباکس سیستم هوشمند را بصورت مستقل در محصول خود مورد استفاده قرار داده است. در مرحله‌ی اول این سیستم بصورت داخلی مورد استفاده قرار گرفته و ماشین هوشمند بصورت آزمایشی در معرض اطلاعاتی قرار گرفته تا صحت عملکرد آن سنجیده شود. این فرایند را در اصطلاح DogDooding می نامند. در این مرحله کل تیم اینباکس روی این سیستم کار کرده و باگ‌های حاصل را یادداشت می‌کنند که نتیجه‌ی آن بهبود عملکرد سیستم در این مورد خاص است. زمانی که سیستم مورد نظر به اندازه‌ای بهبود یافت که اشتباهات آن به میزان قابل قبول رسید، این قابلیت بصورت عمومی در اختیار کاربران قرار می‌گیرد.

گوگل هدف از راه‌اندازی تمام سیستم‌های مبتنی بر ماشین را تسهیل کار کاربران خوانده است. از جمله‌ی محصولات دیگری که از همین سیستم هوشمند استفاده می‌کنند باید به گوگل ناو اشاره کرد. گوگل اعلام کرده که نتیجه‌ی بهره‌گیری از سیستم‌های هوشمند در محصولات این کمپانی، بر عهده گرفتن اموری است که برای کاربران یا عوامل انسانی امری سخت، اما برای ماشین‌ها امری بسیار ساده و سهل است. آپارنا چناپراگادا، مدیر گوگل ناو در مورد عملکرد سیستم‌های هوشمند و علت توسعه‌ی گوگل ناو می‌گوید:

جوانب استفاده از سیستم‌های هوشمند در پلتفرم‌های مختلف باید در نظر گرفته شود؛ چراکه این سیستم‌ها در جهت تکامل و قرار گرفتن در کنار مغز انسان توسعه می‌یابند تا روند زندگی انسان‌ها تسهیل کنند.

هدف غول جستجو از توسعه‌ی سیستم هوشمند و استفاده از آن در سرویس‌های خود که برای مثال می‌توان به گوگل ناو اشاره کرد، ایجاد یک دستیار صوتی هوشمند واقعی و کارا است. این دستیار صوتی هوشمند باید بسیار باهوش باشد . حتی می‌توان این دستیار صوتی را به عنوان بخشی از مغز کاربران در نظر گرفت که پس از خرید گوشی یا استفاده از گجت‌های هوشمند به آن‌ها پیوسته است.

برای اینکه سیستم به چنین قابلیتی رسیده و بتواند شما را در تمام امور یاری کند باید اطلاعاتی را در موارد مختلف دریافت کند. برای مثال سیستم باید در مورد جستجوهای انجام شده توسط کاربر، موزیک‌هایی که کاربر گوش می‌دهد و مکان‌هایی که می‌رود اطلاعاتی را در اختیار داشته باشد.

زمانی که اطلاعات دریافت شده از کاربران مختلف با اطلاعات موجود ترکیب شده و در اختیار KnowledgeGraph این کمپانی قرار بگیرد، کاربران به منبع بسیار آگاهی دسترسی خواهند داشت که می‌تواند آن‌ها در موراد بسیاری یاری دهد. برای مثال در صورتی که شما مکان دقیق فرودگاه شهری را که در آن قرار گرفته‌اید، ندانید، گوشی هوشمندتان از آن اطلاع خواهد داشت و می‌تواند شما را به راحتی به سمت فرودگاه هدایت کند.

یکی دیگر از مواردی که اطلاعات کاربران را برای استفاده‌ی عموم ارزشمند می‌کند، بهره‌گیری از اطلاعات ترافیکی اشتراک گذاشته توسط کاربران است. برای مثال در صورتی که اطلاعات مربوط به موقعیت مکانی کاربران با گوگل به اشتراک گذاشته شوند، گوگل می‌تواند با بهره‌گیری از این اطلاعات به سرعت حرکت کاربران مختلف در مسیرها پی برده و از این‌رو تشخیص دهد که آیا در بزرگراه خاصی ترافیک سنگین وجود دارد یا خیر. این موضوع در مورد تشخیص شلوغ یا خلوت بودن یک رستوران یا کافی شاپ نیز صادق است.

گوگل ناو را باید تمثیلی گویا از مسیر طی شده توسط گوگل برای توسعه‌ی سیستم هوشمند این کمپانی بدانیم.

سازمان‌دهی داده‌های جهان

در بخش قبلی به این موضوع اشاره کردیم که دستیار صوتی گوگل یا همان Google Now از KnowledgeGraph استفاده می‌کند. در ادامه به بررسی این مفهوم و به تشریح آن خواهیم پرداخت.

جان جیاناندار، مدیر موتور جستجوی گوگل در سال ۲۰۱۰ به غول جستجو پیوسته است. وی پیش از پیوستن به گوگل در کمپانی Metaweb که در سال ۲۰۰۴ میلادی تاسیس شده بود، مشغول به کار بود. متاوب یک پایگاه داده‌ی متن‌باز از اطلاعات جهانی را جمع آوری می‌کرد. در واقع کمپانی مورد نظر اطلاعاتی را در حوزه‌های مختلف جمع آوری کرده و توضیحات متنی را به آن‌ها مرتبط می‌کرد. تقریبا این سیستم مشابه سیستم جستجویی بود که گوگل راه‌اندازی کرده بود که همه چیز را در خود جای داده بود. این کمپانی توسط گوگل تصاحب شد و در نتیجه کارکنان آن از جمله خود جیاناندار به این کمپانی پیوستند. وی پس از پیوستن به گوگل نیز روی این پروژه مشغول به کار بود.

تمام پروژه‌ای که متاوب توسعه داده بود، بعدها در KnowledgeGraph یا همان گراف اطلاعات این کمپانی مورد استفاده قرار گرفته و از سال ۲۰۱۲ در سرویس جستجوی گوگل به کار رفت. نتیجه‌ی بکارگیری گراف اطلاعات را می‌توان همان پاپ آپ‌هایی خواند که در صورت جستجوی عباراتی نظیر When was Mercedes Benz Founded می‌توان دید. اگر این عبارت را در جستجوی گوگل تایپ کنید، عدد ۱۹۲۶ برای شما درون یک پاپ آپ نمایش داده می‌شود.

گوگل با استفاده از گراف اطلاعات نه تنها به مرتب کردن اطلاعات موجود در اینترنت کمک شایانی کرد، بلکه آن را در موتور جستجوی خود نیز مورد استفاده قرار داده و وجهه‌ای عملی به این ویژگی داده است. استفاده از گراف اطلاعات را باید اولین کاربری هوش مصنوعی در جستجوی گوگل و به طور کلی اولین کاربری هوش مصنوعی در سرویس‌های گوگل بدانیم. پس از آن گوگل ۱۵ درصد از جستجوهای روزانه خود را به مدل هوش مصنوعی خود که RankBrain نام داشت، انتقال داد. این سیستم قادر بود تا سوالاتی را که سیستم‌های قبلی مورد استفاده قادر به فهم آن نبودند، درک کرده و نتایج مرتبط را برای کاربران نمایش دهد.

هدف نهایی از بکارگیری سیستم‌های مبتنی بر شبکه‌های عصبی ایجاد قابلیتی مشابه هوش انسان در هوش مصنوعی است. برای مثال سیستم‌های کنونی برای ترجمه‌ی یک متن از ترجمه‌ی واژه به واژه در کنار بهره‌گیری از گرامر به منظور ترجمه‌ی صحیح استفاده می‌کنند؛ از این‌رو نمی‌توان برداشتی انسانی را در ترجمه‌های صورت گرفته توسط سیستم‌های رایانه‌ای دید. دانشمندان علت این موضوع را ضعف سخت‌افزاری شبکه‌های عصبی مورد استفاده در مقایسه به هوش انسانی می‌دانند. در واقع حجم شبکه‌های عصبی توسعه یافته در سیستم‌های هوشمند کنونی در مقایسه با مغز انسان بسیار ناچیز است و در نتیجه میزان اطلاعاتی که می‌توان در مغز انسان ذخیره کرد بسیار گسترده‌تر از اطلاعاتی است که شبکه‌های عصبی کنونی قادر به ذخیره‌ی آن هستند.

بسیاری از متخصصان در حوزه‌ی هوش مصنوعی پیشرفت‌های صورت گرفته در پنج سال اخیر را بسیار بزرگ می‌خوانند و با رویکردی مثبت به آینده‌ی این حوزه از دانش رایانه می‌نگرند. باید دید که آیا در سال‌های آینده سیستم‌های هوشمندی مشابه هوش انسانی با قدرت درک و تجزیه‌ی و تحلیل مسائل مختلف توسعه خواهند یافت یا خیر؟ آیا رویای انسان برای ساخت هوش مصنوعی که قادر باشد همچون انسان به تفکر پرداخته و بصورت مستقل در مورد مسائل مختلف تصمیم‌گیری کند، رنگ واقعیت به خود خواهد گرفت یا خیر؟ نظر شما در این خصوص چیست؟

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات