فیسبوک از یادگیری ماشین بدون نظارت برای ترجمه استفاد میکند
هنگامی که برای ترجمهی محتوا با کمک سیستم مبتنی بر هوش مصنوعی، نمونه ترجمههای متعدد و مختلفی در اختیار سیستم نباشد؛ و سیستم بخواهد متن را از زبانی به زبان دیگر، مثلا از زبان انگلیسی به زبان اردو ترجمه کند؛ بهدلیل فقدان دادههای نمونه ترجمه در سیستم، ترجمهی محتوا با مشکل روبرو خواهد شد.
تیم تحقیقاتی فیسبوک، با استفاده از یادگیری ماشین بدون نظارت، برای این مساله تدبیری اندیشید و موفق شد برای ترجمهی محتوا در زبانهایی که تعداد نمونهترجمه در آنها محدود است، راهکاری پیدا کند.
فیسبوک با استفاده از یادگیری ماشین بدون نظارت، میتواند برای زبانهایی که نمونه ترجمه کمتری دارند، ترجمهی خوبی ارائه دهد. این پروژه توسط واحد تحقیقات هوش مصنوعی فیسبوک یا FAIR توسعه یافته است. البته FAIR در تمام مراحل کار از همکاری و مشارکت واحد Applied Machine Learning استفاده کرده است. آنتوان بوردس، کارشناس آزمایشگاه FAIR در پاریس در مصاحبه تلفنی با وبسایت خبری VentureBeat، به همکاری نزدیک این دو واحد تحقیقاتی برای پیشبرد پروژه اشاره کرد. در یادگیری ماشین با نظارت، ۱۰۰.۰۰۰ نمونه ترجمه از یک زبان به زبان دیگر وجود دارد که یادگیری بدون نظارت برای ترجمه از زبانی به زبانی دیگر که نمونه مدل ترجمه کمتری دارد، بهکار برده میشود. آنتونی بوردس معتقد است:
هنگامی که میخواهید متنی را از انگلیسی به زبان اردو ترجمه کنید، نمونه ترجمههای کمتری وجود دارد؛ یادگیری ماشین بدون نظارت، در روش جدید، میتواند حتی عملکردی بهتر از یادگیری ماشین با نظارت را بهنمایش بگذارد. در چنین شرایطی بدین نتیجه رسیدیم که بهجای استفاده از یک سیستم با نظارت ولی همراه با اطلاعات کم و ناقص، از یک سیستم بدون نظارت که آموزش دیده باشد، استفاده کنیم.
پاییز سال ۲۰۱۸ در EMNLP 2018، نتایج تلاشهای محققان هوش مصنوعی فیسبوک، گیولام لمپل و مکاورلیو رانزاتو ارائه خواهد شد. بوردس معتقد است که تحقیقات انجامشده روی این پروژه، یکی از بهترین ایدههایی است که واحد FAIR از سال ۲۰۱۳ تاکنون روی آن سرمایهگذاری کرده است. بوردس در ادامهی صحبتهای خود اظهار داشت:
تصور کنید ما میتوانیم با کمک این روش به سیارهی دیگر برویم و با موجودات فضایی که هیچکس زبان آنها نمیفهمد، صحبت کنیم؛ یا تصورش را بکنید که شما میتوانید زبانی را که تاکنون هیچکس بدان زبان صحبت نکرده است ترجمه کنید. با این روش، امکان ترجمهی دستنوشتهها و متون باستانی و کهن که هنوز رمزگشایی نشدهاند، امکانپذیر خواهد شد. این روش میتواند موفقیتی بزرگ در صنعت ترجمهی متون از زبانهای مختلف با کمک هوش مصنوعی و یادگیری بدون نظارت ایجاد کند که بسیار هیجانانگیز است.
این پروژهی FAIR نیز، همانند بسیاری از پروژههای هوش مصنوعی این واحد، متنباز است و برای دانلود در گیتهاب قابل دسترس خواهد بود. پیشتر نیز گفته شده بود که فرآیند ترجمه در فیسبوک، توسط هوش مصنوعی انجام میشود. اوایل سال جاری، ترجمهی متنباز در فیسبوک با استفاده از سیستم هوش مصنوعی برای قدرت بخشیدن به ترجمه، برای دانلود در گیتهاب قرار گرفت.
سیستمهایی مانند ترجمه، نیاز به تعداد زیادی دادههای برچسبخورده دارند که باید به سیستم آموزش داده شوند. برای مثال، برای ترجمه از زبان فرانسوی به انگلیسی، میلیونها نمونه جمله باید به سیستم داده شود تا بتواند هر دو زبان را بهخوبی درک کند. بدین ترتیب، وقتی نمونه ترجمهها در برخی زبانها بسیار محدود باشد، کار ترجمه در Facebook با مشکل مواجه خواهد شد. چون تعداد جملات نمونهی ترجمهشده در برخی زبانها بسیار محدود است.
سیستم مبتنی بر هوش مصنوعی، میتواند سه عنصر مختلف را بهصورت ترکیبی برای ترجمه مورد استفاده قرار دهد: ترجمهی واژه به واژه، مدلهای ترجمه و back translation. وقتی متنی از یک زبا به زبان دیگر ترجمه شود و سپس متن ترجمهشده مجددا به زبان اصلی برگردانده شود، بدین کار back translation گفته میشود.
ترجمهی واژه به واژه، برای پیشبینی کلمات براساس موضوع متن بهکار برده میشود. پنج کلمهی قبل و بعد کلمهی مورد نظر بهصورت واژه به واژه ترجمه میشود تا سیستم بتواند ترجمهی کلمهی مورد را مشخص کند. پاییز سال گذشته، گیولام لمپل و مکاورلیو رانزاتو این روش را در مقالهای بهصورت مفصل توضیح دادهاند.
مدلهای ترجمه، با دادههای بسیاری از جمله کتابها یا سایر متون نوشتاری، به سیستم آموزش داده میشود؛ تا سیستم بتواند با کمک این دادهها، ترتیب کلمات در جمله و ساختار جمله را تشخیص دهد. با کمک این دادهها، سیستم مبتنی بر هوش مصنوعی میتواند زبان انگلیسی و یا اردو را متوجه شود. در نهایت، back translation، نظارتی بر ترجمهی واژه به واژه و مدلهای ترجمه خواهد داشت. روش جدید ترجمه در فیسبوک ترکیبی از سه روش را برای ارائهی ترجمهای خود به خدمت میگیرد. بوردس در ادامهی صحبتهای خود اضافه کرد:
با استفاده از این ترجمهی کلمه به کلمه، سپس استفاده از مدلهای ترجمه و در نهایت back translation، برای ترجمه زبانی به زبان دیگر، شاهد بهبود قابلتوجهی در ترجمه خواهیم بود.
فیسبوک در نظر دارد در آیندهی نزدیک از سیستم مبتنی بر هوش مصنوعی، بیش از پیش برای ارائهی ترجمهای بهتر، استفاده کند. در این مسیر باید دادههای بیشتری مورد بررسی قرار بگیرند و مختصصان ترجمه، بر محتوای ترجمهشده توسط سیستم مبتنی بر هوش مصنوعی نظارت داشته باشند.
- از سازههای ضد زلزله تا بتُن زنده؛ با معماری هوشمند ۲هزار سال پیش آشنا ...
- شبی که یک شهر سقوط کرد: داستان بزرگترین و وحشتناکترین سرقت مسلحانه برزیل
- ویترینهای خالی، جیبهای خالیتر: چه کسی از حذف لوازم خانگی خارجی سود ...
- ضرب شست BYD به ایلان ماسک؛ وقتی تسلا دنبال کشتی بود، چینیها اقیانوس را ...
- معاون استاندار تهران: با توسعه پنلهای خورشیدی میتوان ناترازی را تا دو ...
اگر قصد دارید یکی از گوشیهای سامسونگ را برای عکاسی بخرید، در این مقاله با بهترین گوشیهای سامسونگ ازنظر دوربین براساس قیمتهای مختلف آشنا خواهید شد.
برای اسکرینشات گرفتن مجبور به استفاده از دکمههای ترکیبی نیستید و میتوانید از امکانات مختلف گوشی سامسونگ برای این کار استفاده کنید.
پرواز ۹۵۲۵ جرمنوینگز، فاجعهای بود که قوانین ایمنی پرواز در سراسر جهان را برای همیشه تغییر داد.
تنوع زیاد هارد اکسترنال در بازار، انتخاب مدل مناسب را دشوار میکند. در این مقاله با بهترین هاردهای اکسترنال موجود در بازار ایران آشنا میشویم.
برای بسیاری از کاربران دوربین گوشی مهمترین بخش آن محسوب میشود؛ اما کدامیک از مدلهای شیائومی بهترین دوربین را در بازههای قیمتی مختلف دارند؟
یک خودرو چینی در حال که هنوز قیمتش مشخص نشده، با استقبال چشمگیر خریداران روبهرو شد.
تنظیمات اینترنت ایرانسل از طریق پیامک یا بهصورت دستی انجام میشوند. در ادامه روش دریافت پیامک و تنظیم دستی apn ایرانسل را آموزش میدهیم.