D1-kifpool

فیسبوک از یادگیری ماشین بدون نظارت برای ترجمه استفاد می‌کند

یک‌شنبه 11 شهریور 1397 - 14:15
مطالعه 5 دقیقه
فیسبوک برای ترجمه‌ی محتوا از زبانی به‌ زبان دیگر، از یادگیری ماشین بدون نظارت استفاده می‌کند.
تبلیغات
D4-mcid4

هنگامی که برای ترجمه‌ی محتوا با کمک سیستم مبتنی بر هوش مصنوعی، نمونه ترجمه‌های متعدد و مختلفی در اختیار سیستم نباشد؛ و سیستم بخواهد متن را از زبانی به زبان دیگر، مثلا از زبان انگلیسی به زبان اردو ترجمه کند؛ به‌دلیل فقدان داده‌های نمونه ترجمه در سیستم، ترجمه‌ی محتوا با مشکل روبرو خواهد شد.

تیم تحقیقاتی فیسبوک، با استفاده از یادگیری ماشین بدون نظارت، برای این مساله تدبیری اندیشید و موفق شد برای ترجمه‌ی محتوا در زبان‌هایی که تعداد نمونه‌ترجمه در آنها محدود است، راهکاری پیدا کند.

فیس بوک

فیسبوک با استفاده از یادگیری ماشین بدون نظارت، می‌تواند برای زبان‌هایی که نمونه ترجمه کمتری دارند، ترجمه‌ی خوبی ارائه دهد. این پروژه توسط واحد تحقیقات هوش مصنوعی فیسبوک یا FAIR توسعه یافته است. البته FAIR در تمام مراحل کار از همکاری و مشارکت واحد Applied Machine Learning استفاده کرده است. آنتوان بوردس، کارشناس آزمایشگاه FAIR در پاریس در مصاحبه تلفنی با وب‌سایت خبری VentureBeat، به همکاری نزدیک این دو واحد تحقیقاتی برای پیشبرد پروژه اشاره کرد. در یادگیری ماشین با نظارت، ۱۰۰.۰۰۰ نمونه‌ ترجمه‌ از یک زبان به زبان دیگر وجود دارد که یادگیری بدون نظارت برای ترجمه از زبانی به زبانی دیگر که نمونه مدل ترجمه کمتری دارد، به‌کار برده می‌شود. آنتونی بوردس معتقد است:

هنگامی که می‌خواهید متنی را از انگلیسی به زبان اردو ترجمه کنید، نمونه ترجمه‌های کمتری وجود دارد؛ یادگیری ماشین بدون نظارت، در روش جدید، می‌تواند حتی عملکردی بهتر از یادگیری ماشین با نظارت را به‌نمایش بگذارد. در چنین شرایطی بدین نتیجه رسیدیم که به‌جای استفاده از یک سیستم با نظارت ولی همراه با اطلاعات کم و ناقص،  از یک سیستم بدون نظارت که آموزش دیده باشد، استفاده کنیم.
سرویس ترجمه فیس بوک

پاییز سال ۲۰۱۸ در EMNLP 2018، نتایج تلاش‌های محققان هوش مصنوعی فیسبوک، گیولام لمپل و مک‌اورلیو رانزاتو ارائه خواهد شد. بوردس معتقد است که تحقیقات انجام‌شده روی این پروژه، یکی از بهترین ایده‌هایی است که واحد FAIR از سال ۲۰۱۳ تاکنون روی آن سرمایه‌گذاری کرده است. بوردس در ادامه‌ی صحبت‌های خود اظهار داشت:

تصور کنید ما می‌توانیم با کمک این روش به سیاره‌ی دیگر برویم و با موجودات فضایی که هیچ‌کس زبان آنها نمی‌فهمد، صحبت کنیم؛ یا تصورش را بکنید که شما می‌توانید زبانی را که تاکنون هیچ‌کس بدان زبان صحبت نکرده است ترجمه کنید. با این روش، امکان ترجمه‌ی دست‌نوشته‌ها و متون باستانی و کهن که هنوز رمزگشایی نشد‌ه‌اند، امکان‌پذیر خواهد شد. این روش می‌تواند موفقیتی بزرگ در صنعت ترجمه‌ی متون از زبان‌های مختلف با کمک هوش مصنوعی و یادگیری بدون نظارت ایجاد کند که بسیار هیجان‌انگیز است.

این پروژه‌ی FAIR نیز، همانند بسیاری از پروژه‌های هوش مصنوعی این واحد، متن‌باز است و برای دانلود در گیت‌هاب قابل دسترس خواهد بود. پیشتر نیز گفته شده بود که فرآیند ترجمه در فیسبوک، توسط هوش مصنوعی انجام می‌شود. اوایل سال جاری، ترجمه‌ی متن‌باز در فیسبوک با استفاده از سیستم هوش مصنوعی برای قدرت بخشیدن به ترجمه، برای دانلود در گیت‌هاب قرار گرفت.

سیستم‌هایی مانند ترجمه‌، نیاز به تعداد زیادی داده‌های برچسب‌خورده دارند که باید به سیستم آموزش داده شوند. برای مثال، برای ترجمه از زبان فرانسوی به انگلیسی، میلیون‌ها نمونه جمله باید به سیستم داده شود تا بتواند هر دو زبان را به‌خوبی درک کند. بدین ترتیب، وقتی نمونه ترجمه‌ها در برخی زبان‌ها بسیار محدود باشد، کار ترجمه در Facebook با مشکل مواجه خواهد شد. چون تعداد جملات نمونه‌ی ترجمه‌شده در برخی زبان‌ها بسیار محدود است.

سیستم مبتنی بر هوش مصنوعی، می‌تواند سه عنصر مختلف را به‌صورت ترکیبی برای ترجمه مورد استفاده قرار دهد: ترجمه‌ی واژه به واژه، مدل‌های ترجمه و back translation. وقتی متنی از یک زبا به زبان دیگر ترجمه شود و سپس متن ترجمه‌شده مجددا به زبان اصلی برگردانده شود، بدین کار back translation گفته می‌شود.

ترجمه ماشینی

ترجمه‌ی واژه به واژه، برای پیش‌بینی کلمات براساس موضوع متن به‌کار برده می‌شود. پنج کلمه‌ی قبل و بعد کلمه‌ی مورد نظر به‌صورت واژه به واژه ترجمه می‌شود تا سیستم بتواند ترجمه‌ی کلمه‌ی مورد را مشخص کند. پاییز سال گذشته، گیولام لمپل و مک‌اورلیو رانزاتو این روش را در مقاله‌ای به‌صورت مفصل توضیح داده‌اند.

مدل‌های ترجمه، با داده‌های بسیاری از جمله کتاب‌ها یا سایر متون نوشتاری، به سیستم آموزش داده می‌شود؛ تا سیستم بتواند با کمک این داده‌ها، ترتیب کلمات در جمله و ساختار جمله را تشخیص دهد. با کمک این داده‌ها، سیستم مبتنی بر هوش مصنوعی می‌تواند زبان انگلیسی و یا اردو را متوجه شود. در نهایت، back translation، نظارتی بر ترجمه‌ی واژه به واژه و مدل‌های ترجمه خواهد داشت. روش جدید ترجمه در فیسبوک ترکیبی از سه روش را برای ارائه‌ی ترجمه‌ای خود به خدمت می‌گیرد. بوردس در ادامه‌ی صحبت‌های خود اضافه کرد:

با استفاده از این ترجمه‌ی کلمه به کلمه، سپس استفاده از مدل‌های ترجمه و در نهایت back translation، برای ترجمه زبانی به زبان دیگر، شاهد بهبود قابل‌توجهی در ترجمه خواهیم بود.

فیسبوک در نظر دارد در آینده‌ی نزدیک از سیستم مبتنی بر هوش مصنوعی، بیش از پیش برای ارائه‌ی ترجمه‌ای بهتر، استفاده کند. در این مسیر باید داده‌های بیشتری مورد بررسی قرار بگیرند و مختصصان ترجمه، بر محتوای ترجمه‌شده‌ توسط سیستم مبتنی بر هوش مصنوعی نظارت داشته باشند.

مقاله رو دوست داشتی؟
نظرت چیه؟
تبلیغات
D5-b3IranServer
داغ‌ترین مطالب روز
بلوبانک
بلوبانک: نگران بازپرداخت وام‌های خود نباشید

بلوبانک اعلام کرد همه جریمه‌های دیرکرد بازپرداخت وام‌های بلو تا پایان تیرماه بخشیده می‌شود.

18
حدود 23 ساعت قبل
BMW Engine / پیشرانه و موتور بی ام و
خودروساز معروف: مردم دیگر به موتور ماشین‌ها اهمیت چندانی نمی‌دهند

نایب‌رئیس فورد می‌گوید که مردم دیگر اهمیت زیادی به موتور خودروهایشان نمی‌دهند و نکات دیگری برایشان در اولویت است.

47
1 روز قبل
کیف اضطراری در مواقع بحران
آمادگی برای شرایط اضطراری: راهنمای کامل آماده‌سازی کوله نجات

چه وسایلی را باید در کیف نجات بگذاریم؟ در این مطلب برای شما توضیح می‌دهیم که در مواقع بحران چه وسایلی را باید همراه خود داشته باشید.

34
2 روز قبل
آمادگی برای زمان جنگ
نکات نجات‌بخش در حملات هوایی؛ با رعایت این موارد ساده، سالم بمانید

در لحظات حساس حملات هوایی، زمان برای اشتباه‌کردن وجود ندارد. فقط چند ثانیه فرصت دارید تا تصمیم درست بگیرید.

64
1 روز قبل
 لیست شماره‌ های اضطراری
لیست شماره‌ های اضطراری که همین حالا باید ذخیره‌شان کنید

در شرایط بحرانی، دانستن چند شماره تماس می‌تواند فرق بین نجات و فاجعه باشد. این مقاله، مهم‌ترین شماره‌های اضطراری کشور را معرفی می‌کند.

68
1 روز قبل
هواپیمای بویینگ ۸-۷۸۷ خطوط هوایی بریتیش ایرویز از نمای جلو
پرواز بی‌سرانجام با ۲۱۴ مسافر؛ چرا این هواپیما به مقصد نرسید؟

سه روز پس‌از سقوط مرگ‌بار هواپیمای بویینگ ۸-۷۸۷، هواپیمایی بریتانیایی از مشکل در یکی از پروازهایش خبر داد.

9
1 روز قبل
جلوگیری از انتشار اخبار بد به کودکان
محافظت از کودکان دربرابر خطرات فضای مجازی؛ معرفی بهترین ابزارهای نظارتی

مدیریت دسترسی کودکان به برنامه‌ها و فضای مجازی از وظایف مهم والدین است. در ادامه چند برنامه‌ی کاربردی را برای این کار معرفی می‌کنیم.

20
حدود 20 ساعت قبل
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات