مهندسین نورولوژی کلمبیا سیستمی رار طراحی کردند که میتواند افکار را به گفتاری هوشمندانه و قابلفهم تبدیل کند. با پایش فعالیتهای مغزی یک فرد، تکنولوژی میتواند لغاتی را که فرد میشنود، با وضوح بیسابقهای بیان کند. این اختراع شگرف، علاوه بر اینکه میتواند قدرت سنتسایزر های گفتار و هوش مصنوعی را از آنها بگیرد، میتواند به راههای جدیدی منجر شود که طی آن کامپیوترها بتوانند به طور مستقیم با مغز ارتباط برقرار کنند. این مهم زمینهساز راه چاره برای افرادی است که نمیتوانند صحبت کنند، مثل افرادی که مبتلا به اسکلروز جانبی آمیوتروفیک (ALS) میباشند و یا افرادی که سکته مغزی داشتهاند و میخواهند توانایی ارتباط برقرار کردن خود را پیدا کنند.
نتایج این یافتهها در ژورنال Scientific Reports به چاپ رسیدهاست.
Nima Mesgarani که نویسنده اصلی مقاله و یکی از پژوهشگران برجسته دانشگاه کلمبیا میباشد، در این باره میگوید:
صداهایمان به ما کمک میکنندتا ما با خانوانده، دوستان و دنیای اطراف خود مرتبط باشیم. به این دلیل است که از دست دادن صدا بر اثر تصادف و یا بیماری برای یک شخص بسیار ویرانگر است. ما نشان دادهایم که با تکنولوژی مناسب، میتوان کدگزاری افکار شخص را شکست و آن را برای هر شنوندهای قابلفهم کرد.
دههها مطالعه نشان دادهاست، هنگامی که افراد صحبت میکنند_و یا حتی اگر به آن فکر کنند_ فعالیتهای مغز به صورت سلسلهای از الگوها خود را نشان میدهند. الگویی مجزا ولی قابل تشخیص نیز هنگامی که ما به صحبتهای یک فرد گوش میدهیم، فعال میشود(این مورد درمورد تصور گوش کردن نیز صادق است).متخصصین در تلاشند تا این الگوهارا رمزیابی کنند. آیندهای را تصور کنید که افکار دیگر نمیتوانند در مغز پنهان شوند، بلکه هرزمان میتوانند به گفتار ترجمه شوند.
امابه نظر میرسد دستیابی به این آینده با چالشهایی همراه است. تلاشهای اولیه دکتر مسگرانی و همکارانش برای رمزیابی مغز بیشتر حول مدلهای ساده کامپیوتری میباشد که آنالیز اسپکتروگرامها را برعهده دارند.
اما چون این نگرش در امر تولید محتوایی شبیه گفتار هوشمند شکست خوردهاست، تیم دکتر مسگرانی به یک Vocoder روی آوردهاند، یک الگوریتم رایانهای که میتواند پس ازگذراندن دورههای تمرینی خود باصدای ضبطشده صحبتکنندگان، گفتار را سنتسایز کند دکتر توضیح میدهد:
این همان تکنولولژی است که توسط Amazon Echo و Apple Siri به کار گرفتهشدهاست تا به سوالاتمان پاسخ دهند.
دکتر مسگرانی برای اینکه به Vecoder طرز تعامل با فعالیتهای مغزی را آموزش بدهند، با Ashesh Dinesh Mehta تیمی را تشکیل دادند. دکتر Mehta یک جراح مغزواعصاب است که در انستیتو علوم اعصاب Northwell فعالیت میکند و نویسنده همکار این مقاله است.وی عمدتا در زمینه مداوای صرع فعالیت میکند، به طوری که برخی بیماراناو نیاز به چندین بار عمل جراحی منظم دارند.
دکتر مسگرانی میگوید:
هنگام کار با دکتر Mehta، ما از بیماران صرعی که تحت عمل جراحی بودند، درخواست کردیم تا به جملاتی از افراد مختلف به دقت گوش کنند. در آن هنگام ما فعالیتهای مغزی آنان را اندازهگیری میکردیم. این الگوهای نورونی ایجاد شده، Vocoder را اموزش میدادند.
سپس محققان از همان بیماران مذکور در بالا خواستند که به صدای اعداد بیان شده بین ۰ تا ۹ گوش دهند. صدای ایجاد شده توسط Vecoder که در پاسخ به سیگنال های اعداد پخششده از بلندگو ایجاد میشد، توسط شبکههای نورونی آنالیز و پاکسازی شد. شبکههای نورونی نوعی از هوش مصنوعی هستند که ساختار نورونهای موجود در مغز طبیعی را تقلید میکنند.
نتیجه نهایی، صدای روباتمانندی است که تعدادی از اعداد را میخواند.دکتر مسگرانی و همکارانش برای تعیین دقت ضبط، از شرکتکنندگان در آزمایش خواستند که به این صدا گوش کنند و آنچه را که شنیدهاند، گزارش کنند.دکتر مسگرانی نتیجه را اینطور بیان میکند:
نتایج نشان داد که ۷۵% افراد میتوانستند صداها را درک و تکرار کنند، درصدی که خیلی بیشتر از مطالعات قبلی بود. بهبود در هوشمندی به خصوص وقتی آشکار شد که بین ضبطهای جدید با ضبطهای حاصل از مطالعات قبلی مقایسه به عمل آمد. با وجود Vecoder حساس و شبکههای نورونی قدرتمند حساسیت شگفتآوری حاصل گردید.
دکتر مسگرانی و تیمش در نظر دارند تا آزمایش مورد بحث را با جملات و کلمات پیچیدهتر و با هدف قرار دادن سیگنالهایی که هنگام صحبت کردن ایجاد میشود، انجام دهند.در نهایت آنها امیدوارند سیستمی که ایجاد کردهاند، بخشی از یک ایمپلنت باشد، مشابه آنهایی که توسط برخی بیماران صرعی استفاده میشود که افکار بیمار را به طور مستقیم به کلمات بیان میکنند.