کشف روشی برای خواندن افکار با استفاده از دستگاه MRI

پنج‌شنبه 26 آبان 1401 - 17:00

مطالعه 7 دقیقه

تکنیک رمزگشایی زبان از فعالیت مغز با استفاده از داده‌های fMRI ظاهراً نخستین روشی است که چنین کاری را به‌صورت غیرتهاجمی انجام می‌دهد.

تبلیغات

روش ابداعی‌ یک تیم پژوهشی این توانایی را دارد که از ضبط‌های مغزی تصویربرداری تشدید مغناطیسی کاربردی (اختصاراً fMRI) برای بازسازی زبان انسان به‌صورت پیوسته استفاده کند. کار اخیر نخستین نمونه در نوع خود به‌شمار می‌رود. این یافته‌ها به‌منزله‌ی گامی جدید در مسیر جستجو به‌دنبال رابط‌های بهتر میان مغز انسان و کامپیوتر محسوب می‌شود. چنین رابط‌هایی می‌توانند به‌عنوان یک فناوری کمکی برای کسانی توسعه یابند که امکان صحبت یا تایپ کردن به شکل متداول را ندارند.

در مقاله‌‌‌ای که ۲۹ ماه سپتامبر به‌صورت پیش‌انتشار در پایگاه داده bioRxiv بارگذاری شده، تیمی در دانشگاه آستین تگزاس «رمزگشا» یا الگوریتمی را توضیح می‌دهند که توانایی «خواندن» کلماتی را دارد که فرد در طول اسکن مغزی از نوع تصویربرداری تشدید مغناطیسی عملکردی (fMRI)، شنیده یا به آن‌ها فکر کرده است. درحالی‌که تیم های دیگر پیش از این موفقیت‌هایی را در بازسازی زبان یا تصاویر براساس سیگنال‌های ایمپلنت در مغز گزارش کرده بودند، سیستم رمزگشای جدید اولین رویکردی است که از یک روش غیرتهاجمی برای انجام این کار استفاده می‌کند. الکساندر هوث، عصب‌شناس دانشگاه آستین تگزاس و یکی از نویسندگان این مطالعه می‌گوید:

اگر بیست سال پیش از هر عصب‌شناس شناختی در جهان می‌پرسیدید که آیا این کار شدنی است یا خیر، آن‌ها به شما می‌خندیدند.

یوکیاسو کامیتانی، عصب‌شناس محاسباتی در دانشگاه کیوتو که در این تحقیق شرکت نداشته، در ایمیلی به پایگاه The Scientist اظهار می‌کند که دیدن توالی‌های زبانی قابل فهم تولیدشده از یک رمزگشای غیرتهاجمی برایش بسیار «هیجان‌انگیز» بوده است و اینکه «این مطالعه، زمینه‌ای محکم برای توسعه‌ی برنامه‌های [رابط مغز و رایانه] ایجاد می‌کند».

نباید فراموش کنیم که استفاده از داده‌های fMRI برای چنین تحقیقاتی اساساً کاری دشوار است؛ زیرا سرعت عملکرد سیستم‌های داده‌ی fMRI در مقایسه با سرعت افکار انسان نسبتاً کند است. دستگاه‌های MRI به‌جای تشخیص و دنبال کردن کارکرد نورون‌ها که در مقیاس میلی‌ثانیه اتفاق می‌افتد، تغییرات جریان خون در مغز را به‌عنوان نماینده‌ای از فعالیت مغز اندازه‌گیری می‌کنند. چنین تغییراتی چند ثانیه طول می‌کشد. به‌گفته‌ی هوث، دلیل کارآمدی روش یادشده در تحقیق اخیر این است که سیستم ابداعی، زبان را نه به‌صورت کلمه‌به‌کلمه، بلکه به صورت سطح بالاتر و در قواره‌ی یک جمله یا فکر تشخیص داده و رمزگشایی می‌کند.

مقاله‌های مرتبط:

مغز مردانی که برای اولین‌بار پدر می‌شوند، ممکن است کوچک شود

هوث و همکارانش الگوریتم خود را با اتکا به ثبت‌های مغزی fMRI توسط هوش مصنوعی تمرین دادند. سوژه‌های مطالعاتی آن‌ها یک زن و دو مرد (همگی در دهه‌های سوم یا چهارم زندگی) را شامل می‌شد. آن‌ها به ۱۶ ساعت پادکست و داستان‌های رادیویی گوش دادند. برنامه‌های بعضاً شناخته‌شده‌ای همچون The Moth Radio Hour، تد تالک و John Green's Anthropocene Reviewed از جمله رسانه‌های مورد استفاده در این آزمایش بودند. به‌گفته‌ی هوث، در مسیر ساخت یک رمزگشای دقیق و با امکان کاربرد گسترده، مهم است که افراد شرکت‌کننده در تحقیق به طیف وسیعی از رسانه‌ها گوش دهند. او خاطرنشان می‌کند که مقدار داده‌های fMRI جمع‌آوری‌شده با اکثر مطالعات دیگری که از ضبط‌های fMRI استفاده می‌کنند، مطابقت دارد؛ اگرچه او سوژه‌های تحقیقاتی کمتری دراختیار داشت.

سیستم رمزگشا براساس آموزش ۱۶ ساعته‌ی ضبط fMRI مغز فرد، مجموعه‌ای از پیش‌بینی‌ها را از ظاهر خوانش‌های fMRI انجام داد. به‌گفته هوث، استفاده از این «حدس‌ها» کلید تضمین و تأییدی بر این نکته بود که رمزگشا می‌تواند افکاری را ترجمه کند که لزوماً به یکی از ضبط‌های صوتی شناخته‌شده‌ی استفاده‌شده در طی تمرین توسط هوش مصنوعی مربوط نیستند. سپس این «حدس‌ها» دربرابر ضبط زمان حقیقی fMRI بررسی شدند و درنهایت پیش‌بینی‌‌ که با خوانش‌های واقعی fMRI مطابقت بیشتری داشت، همان کلماتی را تعیین کرد که سیستم رمزگشا در مرحله‌ی آخر تولید کرده بود.

محققان برای تعیین میزان موفقیت رمزگشا، شباهت نسل رمزگشا را با محرک‌های ارائه‌شده به سوژه ارزیابی کردند. آن‌ها همچنین زبان تولیدشده توسط همان رمزگشا را که دربرابر ضبط fMRI بررسی نشده بود، مورد بررسی و امتیازدهی قرار دادند. پژوهشگران پس از آن، نمرات ثبت‌شده را مقایسه و اهمیت آماری تفاوت بین این دو را آزمایش کردند.

مقاله‌های مرتبط:

افکار ما از کجا سرچشمه می‌گیرند؟

نتایج نشان داد که روش حدس و بررسی الگوریتم در نهایت یک داستان کامل از ضبط‌های fMRI ایجاد می‌کند که به گفته‌ی هوث، به‌شکلی «بسیار خوب» با داستان واقعی روایت‌شده در ضبط مطابقت دارد. بااین‌حال، کاستی‌هایی نیز در الگوریتم وجود دارد. برای مثال، این سیستم در حفظ ضمایر چندان خوب نیست و اغلب ضمایر اول شخص و سوم شخص را با هم اشتباه می‌گیرد. بنابر بر توضیح هوث، رمزگشا «می‌داند که چه اتفاقی در حال رخ دادن است؛ اما نمی‌داند چه کسی این کارها را انجام می‌دهد».

به‌باور سام ناستاسه، محقق و مدرس مؤسسه علوم اعصاب پرینستون، استفاده از ضبط‌های fMRI برای این نوع رمزگشایی مغز، «دیوانه‌کننده» است؛ زیرا چنین داده‌هایی معمولاً بسیار کند و پر سروصدا هستند. او می‌افزاید:

آن‌ها با این مقاله نشان می‌دهند که اگر چارچوب مدل‌سازی به اندازه‌ی کافی هوشمندانه داشته باشیم، می‌توانیم مقدار شگفت‌انگیزی از اطلاعات را از میان ضبط‌های fMRI استخراج کنیم.

بنابر گفته‌های هوث و یافته‌های تیم او، ازآنجاکه رمزگشا از ضبط‌های مغزی fMRI غیرتهاجمی استفاده می‌کند، درنتیجه پتانسیل بالاتری برای کاربرد در دنیای واقعی نسبت به روش‌های تهاجمی دارد. بااین‌حال هزینه و زحمت استفاده از دستگاه‌های MRI یک چالش آشکار است. او می‌گوید:

مگنتوآنسفالوگرافی یا مغناطیس‌نگاری مغزی، یکی دیگر از تکنیک‌های غیرتهاجمی، اما قابل حمل‌تر تصویربرداری مغز به شمار می‌رود و از نظر زمانی دقیق‌تر از fMRI است. این تکنیک می‌تواند به‌طور بالقوه با رمزگشای محاسباتی مشابه برای ارائه‌ی روشی برای ارتباط غیرکلامی افراد به کار برده شود.

هوث معتقد است که هیجان‌انگیزترین مؤلفه‌ی موفقیت رمزگشای آن‌ها به «بینشی» مربوط می‌شود که از عملکرد مغز به دست می‌دهد. به‌عنوان مثال، وی به بخش‌هایی از نتایج تحقیقشان درمورد نزدیک‌تر شدن به پاسخ این پرسش که «کدام قسمت‌های مغز مسئول ایجاد معنا هستند؟» اشاره می‌کند. تیم پژوهشی با استفاده از این سیستم رمزگشا و در طی ضبط داده‌های نواحی خاص مانند قشر جلوی مغز یا قشر گیجگاهی جداری، توانستند تعیین کنند که هر کدام از این قسمت‌های مغز انسان، نشان‌دهنده‌ی چه اطلاعات معنایی هستند. برپایه‌ی یکی از یافته‌های جالب آن‌ها، دو بخش یادشده از مغز اطلاعات یکسانی را به رمزگشا نشان می‌دادند و رمزگشا هنگام استفاده از ضبط‌های به‌دست‌آمده از هر دوی آن ناحیه‌ها به‌خوبی و به شکلی مشابه کار می‌کرد.

هوث اضافه می‌کند شگفت‌انگیزترین جنبه‌ی سیستم اخیر مربوط به توانایی رمزگشا در بازسازی محرک‌هایی بود که از زبان معنایی استفاده نمی‌کردند؛ حتی با وجود اینکه در مورد موضوعات گوش‌داده‌شده زبان گفتاری، آموزش داده شده بود. به‌عنوان یک مثال برای آشکارتر شدن این عبارت باید اشاره کنیم که الگوریتم دانشمندان پس از یادگیری، معنای موضوعات یک فیلم صامت مشاهده‌شده از سوی سوژه‌های تحقیق را با موفقیت بازسازی کرد. این الگوریتم همچنین تجربه‌ی مبتنی بر تصور یک شرکت‌کننده از روایت یک داستان را بازسازی کرد. هوث همچنین می‌گوید:

این واقعیت که آن پدیده‌ها [در مغز] به مقدار زیادی با هم تداخل دارند، چیزی است که به‌تازگی شروع به درکش کرده‌ایم.

نتایج آزمایشگاه هوث (که البته هنوز مورد بازبینی همتا قرار نگرفته‌اند) هم از نظر کامیتانی و هم ناستاسه، سوالاتی را پیرامون چگونگی پردازش رمزگشاها درمقابل زبان‌های متنی یا زبان‌های گفتارمانند، در ذهن پدید می‌آورد. ناستاسه می‌گوید:

ازآنجاکه رمزگشای جدید به جای کلمات منفرد، معنا یا معناشناسی واقع در پس جملات را تشخیص می‌دهد، اندازه‌گیری موفقیت آن می‌تواند دشوار باشد، زیرا ترکیب‌های متعددی از کلمات می‌توانند به‌عنوان یک خروجی خوب محسوب شوند. این مسئله‌ی جالب از کار آن‌ها بیرون آمده است.

هوث تصدیق می‌کند که شاید به‌زعم برخی افراد، فناوری‌های اینچنینی که قادر به «خواندن ذهن» هستند، تا حدی وحشتناک یا ترسناک جلوه کنند. وی تصریح می‌کند که تیم پژوهشی تحت سرپرستی‌اش عمیقاً درمورد پیامدهای این تحقیق و مسیرهای احتمالی فکر کرده‌اند و به‌دلیل نگرانی‌های موجود پیرامون حفظ حریم خصوصی ذهنی، به سراغ بررسی امکان یک موضوع وسوسه‌برانگیز نیز رفته‌اند: آیا رمزگشا بدون همکاری شرکت‌کننده کار می‌کند؟

محققان در برخی آزمایش‌ها و هم‌زمان با پخش صدا، از افراد تحت آزمایش خواستند تا با انجام کارهای ذهنی دیگری همانند شمارش، نام‌گذاری و تصور حیوانات و تصور گفتن داستانی متفاوت، حواس خود را پرت کنند. آن‌ها در ادامه دریافتند که نام‌گذاری و تخیل حیوانات در نادرست کردن رمزگشایی مؤثرتر است.

مقاله‌های مرتبط:

مغز انسان چگونه افکار خود را از دیگران تفکیک می‌کند

از طرفی از نقطه نظر حفظ حریم خصوصی باید به یک نکته‌ی مهم توجه کنیم: رمزگشای آموزش‌دیده در اسکن مغز یک فرد نمی‌تواند زبان فرد دیگر را بازسازی کند و اساساً هیچ اطلاعات قابل استفاده‌ای را در این مطالعه باز نمی‌گرداند. از همین روی احتمالاً خودتان نیز متوجه شده باشید که در چنین سیستمی قبل از هرگونه رمزگشایی دقیق از افکار یک انسان، آن شخص بایستی با آگاهی و تصمیم خودش در جلسات آموزشی گسترده شرکت کند.

از نظر ناستاسه، این واقعیت که محققان به‌دنبال شواهدی مبنی بر حفاظت از حریم خصوصی ذهنی بوده‌اند، مسئله‌ای دلگرم کننده است. وی می‌گوید:

[آن‌ها] به‌راحتی می‌توانستند این مقاله را شش ماه پیش بدون هیچ یک از آن آزمایش‌ها [حریم خصوصی] منتشر کنند.

هرچند که او هنوز به‌طور کامل با توضیحات نویسندگان مقاله پژوهشی پیرامون اینکه آزمایش‌های آن‌ها و سیستم رمزگشا، هیچ جنبه‌ی نگران‌کننده‌ای برای حریم خصوصی ندارد، متقاعد نشده است. از طرفی باید توجه کنیم که تحقیقات آینده احتمالاً خواهند توانست راه‌هایی را برای رفع محدودیت‌های حریم خصوصی ذهنی مطرح‌شده در این تحقیق پیدا کنند و در آن صورت باید نگران باشیم. ناستاسه در انتها توضیح می‌دهد:

آیا مزایای فناوری‌هایی از این دست بیشتر از دام‌ها یا خطرات احتمالی آن‌ها است یا خیر؟ این سؤال بسیار مهمی است.

مقاله رو دوست داشتی؟

نظرت چیه؟

بابک قهرمانی

نظرات