دانشمندان سیگنال‌های مغز را به گفتار تبدیل کردند

جمعه ۶ اردیبهشت ۱۳۹۸ - ۱۶:۵۰
مطالعه 4 دقیقه
پژوهشگران موفق به تولید یک صدای پروتزی شدند که بدون نیاز به حرکات عضلات آن‌چه مغز قصد گفتن آن را دارد، به صدایی قابل درک تبدیل می‌کند.
تبلیغات

ژان دومینیک بوبی در خاطرات خود در کتاب پیله و پروانه (لباس غواصی و پروانه) نوشت:

من در سر خود، ده‌ها بار یک جمله را پس‌و‌پیش می‌کنم، یک واژه را حذف می‌کنم، یک صفت به آن اضافه می‌کنم و متن خویش را با قلبم پاراگراف به پاراگراف می‌خوانم.

بوبی که روزنامه‌نگار و سردبیر بود، در این کتاب زندگی خود را قبل و بعد از یک سکته‌ی فلج‌کننده که موجب شد حرکات عضلات او متوقف شوند، به‌خاطر می‌آورد. او حرف به حرف کتابش را تنها با استفاده از حرکات پلک یکی از چشمانش به رشته‌ی تحریر درآورد. هزاران نفر از مردم به‌خاطر آسیب ناشی از تصادف یا درگیری، سکته یا بیماری‌های نورودژنراتیوی مانند ALS که توانایی صحبت کردن فرد را می‌گیرد، دچار این وضعیت شده و این نوع رنج‌آور ارتباط را تجربه می‌کنند.

به‌تازگی دانشمندان از توسعه‌ی یک صدای پروتزی مجازی خبر داده‌اند؛ سیستمی که منظورهای صوتی مغز را درک می‌کند و آن‌ها را بدون نیاز به هیچ‌گونه حرکت عضلانی، به قابل درک‌ترین گفتار تبدیل می‌کند.

استیون هاوکینگ، فیزیکدان و نویسنده‌ی معروف نیز از حرکات ماهیچه‌های گونه‌اش برای تایپ کردن کاراکترهای صفحه کلید استفاده می‌کرد و کامپیوتری که دانشمندان مختص او طراحی کرده بودند، این علایم را به گفتار تبدیل می‌کرد. دکتر آنتونی ریتاچیو دانشمند علوم اعصاب در کلینیک مایو که عضوی از این گروه پژوهشی نبوده است، می‌گوید:

این موفقتی بزرگ است و ما را به‌سمت سطح جدیدی از بازیابی گفتار به‌وسیله‌ی رمزگشایی از سیگنال‌های مغز می‌برد.

البته پژوهشگران دستیارهای گفتاری مجازی دیگری نیز توسعه داده‌اند. سیستم‌هایی که با رمزگشایی از سیگنال‌های مغز مسئول تشخیص حرف و کلمات کار می‌کنند اما آن رویکردها سرعت و پویایی گفتار طبیعی را ندارد.

سیستم جدید که به‌تازگی در مجله‌ی Nature تشریح شده است، دستورهای حرکتی مغز را با راهنمایی حرکات صوتی در جریان گفتار (ضربه زدن با زبان یا باریک کردن لب‌ها) رمزگشایی می‌کند و جملات قابل‌فهمی را ایجاد می‌کند که شبیه صدای طبیعی فرد است. کارشناسان گفته‌اند که کار جدید یک اثبات اصل است؛ پیش نمایشی از آنچه شاید پس از انجام آزمایش‌ها و اصلاحات آینده امکان‌پذیر شود. این سیستم روی افرادی که به‌طور طبیعی صحبت می‌کنند، آزمایش شده است و هنوز در افرادی که دچار اختلالات عصبی یا آسیب‌هایی مانند سکته هستند و ممکن است در آن‌ها رمزگشایی دشوار یا غیرممکن باشد، مورد آزمایش قرار نگرفته است.

الکترود

برای آزمایش جدید، دانشمندان دانشگاه کالیفرنیا در سان‌فرانسیسکو و برکلی، ۵ نفر را که در بیمارستان برای جراحی صرع تحت ارزیابی بودند، به کار گرفتند. در بسیاری از افراد مبتلا به صرع، داروها چندان اثری ندارند و آن‌ها مجبورند جراحی مغز انجام دهند. قبل از عمل، پزشکان ابتدا باید منطقه‌ای از مغز را که تشنج‌ها از آنجا آغاز می‌شوند، تعیین کنند. این کار با استفاده از الکترودهایی که داخل یا روی سطح مغز قرار داده می‌شود و بررسی جریان‌های الکتریکی موجود در آن قسمت از مغز انجام می‌شود. پیدا کردن این نقطه ممکن است هفته‌ها زمان ببرد. حتی ممکن است به‌مدت چندین روز الکترودها درون یا نزدیک مناطقی از مغز که در سیگنال‌دهی حرکت و شنوایی نقش دارند، قرار داده شود.

بیماران اغلب اجازه می‌دهند هم‌زمان آزمایش‌های دیگری نیز روی آن‌ها انجام شود. ۵ نفر از این افراد موافقت کردند که ژنراتورهای صدای مجازی را آزمایش کنند. روی سطح مغز هرکدام از آن‌ها یک یا دو آرایه‌ی الکترودی قرار داده شد: بالشتکی اندازه‌ی یک مهر که حاوی صدها الکترود کوچک بود. همان‌طور که هر شرکت‌کننده صدها جمله را می‌خواند، این الکترودها الگوهای برانگیختگی نورون‌ها را در قشر حرکتی مغز آن‌ها ثبت می‌کردند. پژوهشگران آن الگوها را با حرکات ظریف لب‌ها، زبان، حنجره و فک بیمار که طی خوانش طبیعی اتفاق می‌افتاد، ارتباط دادند و سپس این حرکات را به گفتار ترجمه کردند.

در ادامه‌ی آزمایش، از افرادی که زبان مادریشان انگلیسی بود، خواسته شد به جملات گوش دهند و میزان روان بودن صداهای مجازی را مشخص کنند. نتایج مطالعه نشان می‌داد که تا ۷۰ درصد از گفتاری که توسط سیستم مجازی تولید می‌شد، قابل درک بود. دکتر ادوارد چانگ یکی از نویسندگان مقاله می‌گوید:

ما نشان دادیم به‌وسیله‌ی رمزگشایی از فعالیت مغزی مرتبط با تولید گفتار، می‌توانیم گفتاری را شبیه‌سازی کنیم که دقیق‌تر و طبیعی‌تر از گفتار سنتز شده براساس استخراج نمایش‌های صوتی حاصل از مغز باشد.

سیستم‌های ارتباطی مبتنی بر ایمپلنت که در گذشته توسعه یافته است، در هر دقیقه حدود ۸ کلمه تولید می‌کرد. برنامه‌ی جدید حدود ۱۵۰ کلمه در دقیقه ایجاد می‌کند یعنی سرعت گفتار طبیعی را دارد. پژوهشگران همچنین دریافتند که یک سیستم صوتی سنتز شده براساس فعالیت مغزی یک فرد می‌تواند توسط افراد دیگر نیز مورد استفاده قرار گیرد و تطابق پیدا کند.

پژوهشگران قصد دارند که برای آزمایش بیشتر این سیستم، آزمایش‌های بالینی انجام دهند. شاید بزرگ‌ترین چالش بالینی، پیدا کردن بیماران مناسب باشد: سکته‌هایی که موجب ناتوانی تکلم فرد می‌شوند، اغلب به مناطقی از مغز که در تولید گفتار نقش دارند، آسیب وارد یا آن‌ها را پاک می‌کند. بااین‌حال، فناوری رابط بین مغز و ماشین در حال پیشرفت است و گروه‌های مختلفی از پژوهشگران در سرتاسر جهان در حال انجام اصلاحاتی روی آن هستند و ممکن است روزی برای آسیب‌های گفتاری خاص قابل استفاده باشند. پژوهشگران امیدوارند که با پیشرفت ‌های مداوم، سرانجام افراد دچار اختلالات گفتاری توانایی سخن گفتن آزادانه را پیدا کنند و با جهان اطراف خود مجددا ارتباط برقرار کنند.

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات