دانشمندان سیگنال‌های مغزی را به طور مستقیم به گفتار تبدیل می‌کنند

مهندسین نورولوژی کلمبیا سیستمی رار طراحی کردند که می‌تواند افکار را به گفتاری هوشمندانه و قابل‌فهم تبدیل کند. با پایش فعالیت‌های مغزی یک فرد، تکنولوژی می‌تواند لغاتی را که فرد می‌شنود، با وضوح بی‌سابقه‌ای بیان کند. این اختراع شگرف، علاوه بر اینکه می‌تواند قدرت سنت‌سایزر های گفتار و هوش مصنوعی را از آن‌ها بگیرد، می‌تواند به راه‌های جدیدی منجر شود که طی آن کامپیوترها بتوانند به طور مستقیم با مغز ارتباط برقرار کنند. این مهم زمینه‌ساز راه چاره برای افرادی است که نمی‌توانند صحبت کنند، مثل افرادی که مبتلا به اسکلروز جانبی آمیوتروفیک (ALS) می‌باشند و یا افرادی که سکته مغزی داشته‌اند و می‌خواهند توانایی ارتباط برقرار کردن خود را پیدا کنند.

نتایج این یافته‌ها در ژورنال Scientific Reports به چاپ رسیده‌است.

Nima Mesgarani که نویسنده اصلی مقاله و یکی از پژوهشگران برجسته دانشگاه کلمبیا می‌باشد، در این باره می‌گوید:

صداهایمان به ما کمک می‌کنندتا ما با خانوانده، دوستان و دنیای اطراف خود مرتبط باشیم. به این دلیل است که از دست دادن صدا بر اثر تصادف و یا بیماری برای یک شخص بسیار ویران‌گر است. ما نشان داده‌ایم که با تکنولوژی مناسب، می‌توان کدگزاری افکار شخص را شکست و آن را برای هر شنونده‌ای قابل‌فهم کرد.

دهه‌ها مطالعه نشان داده‌است، هنگامی که افراد صحبت می‌کنند_و یا حتی اگر به آن فکر کنند_ فعالیت‌های مغز به صورت سلسله‌ای از الگوها خود را نشان می‌دهند. الگویی مجزا ولی قابل تشخیص نیز هنگامی که ما به صحبت‌های یک فرد گوش می‌دهیم، فعال می‌شود(این مورد درمورد تصور گوش کردن نیز صادق است).متخصصین در تلاشند تا این الگوهارا رمزیابی کنند. آینده‌ای را تصور کنید که افکار دیگر نمی‌توانند در مغز پنهان شوند، بلکه هرزمان می‌توانند به گفتار ترجمه شوند.

امابه نظر می‌رسد دستیابی به این آینده با چالش‌هایی همراه است. تلاش‌های اولیه دکتر مسگرانی و همکارانش برای رمزیابی مغز بیشتر حول مدل‌های ساده کامپیوتری می‌باشد که آنالیز اسپکتروگرام‌ها را برعهده دارند.

اما چون این نگرش در امر تولید محتوایی شبیه گفتار هوشمند شکست خورده‌است، تیم دکتر مسگرانی به یک Vocoder روی آورده‌اند، یک الگوریتم رایانه‌ای که می‌تواند پس ازگذراندن دوره‌های تمرینی خود باصدای ضبط‌شده صحبت‌کنندگان، گفتار را سنت‌سایز کند دکتر توضیح می‌دهد:

این همان تکنولولژی است که توسط Amazon Echo و Apple Siri به کار گرفته‌شده‌است تا به سوالاتمان پاسخ دهند.

دکتر مسگرانی برای اینکه به Vecoder طرز تعامل با فعالیت‌های مغزی را آموزش بدهند، با Ashesh Dinesh Mehta تیمی را تشکیل دادند. دکتر Mehta یک جراح مغزواعصاب است که در انستیتو علوم اعصاب Northwell فعالیت می‌کند و نویسنده همکار این مقاله است.وی عمدتا در زمینه مداوای صرع فعالیت می‌کند، به طوری که برخی بیماران‌او نیاز به چندین بار عمل جراحی منظم دارند.

دکتر مسگرانی می‌گوید:

هنگام کار با دکتر Mehta، ما از بیماران صرعی که تحت عمل جراحی بودند، درخواست کردیم تا به جملاتی از افراد مختلف به دقت گوش کنند. در آن هنگام ما فعالیت‌های مغزی آنان را اندازه‌گیری می‌کردیم. این الگوهای نورونی ایجاد شده، Vocoder را اموزش می‌دادند.

سپس محققان از همان بیماران مذکور در بالا خواستند که به صدای اعداد بیان شده بین ۰ تا ۹ گوش دهند. صدای ایجاد شده توسط Vecoder که در پاسخ به سیگنال های اعداد پخش‌شده از بلندگو ایجاد می‌شد، توسط شبکه‌های نورونی آنالیز و پاک‌سازی شد. شبکه‌های نورونی نوعی از هوش مصنوعی هستند که ساختار نورون‌های موجود در مغز طبیعی را تقلید می‌کنند.

نتیجه نهایی، صدای روبات‌مانندی است که تعدادی از اعداد را می‌خواند.دکتر مسگرانی و همکارانش برای تعیین دقت ضبط، از شرکت‌کنندگان در آزمایش خواستند که به این صدا گوش کنند و آنچه را که شنیده‌اند، گزارش کنند.دکتر مسگرانی نتیجه را اینطور بیان می‌کند:

نتایج نشان داد که ۷۵% افراد می‌توانستند صداها را درک و تکرار کنند، درصدی که خیلی بیشتر از مطالعات قبلی بود. بهبود در هوشمندی به خصوص وقتی آشکار شد که بین ضبط‌های جدید با ضبط‌های حاصل از مطالعات قبلی مقایسه به عمل آمد. با وجود Vecoder حساس و شبکه‌های نورونی قدرتمند حساسیت شگفت‌آوری حاصل گردید.

دکتر مسگرانی و تیمش در نظر دارند تا آزمایش مورد بحث را با جملات و کلمات پیچیده‌تر و با هدف قرار دادن سیگنال‌هایی که هنگام صحبت کردن ایجاد می‌شود، انجام دهند.در نهایت آن‌ها امیدوارند سیستمی که ایجاد کرده‌اند، بخشی از یک ایمپلنت باشد، مشابه ‌آن‌هایی که توسط برخی بیماران صرعی استفاده می‌شود که افکار بیمار را به طور مستقیم به کلمات بیان می‌کنند.

دانشمندان سیگنال‌های مغزی را به طور مستقیم به گفتار تبدیل می‌کنند

درباره دکتر مجازی

درباره ما