تصور کنید بتوانید تصویر مورد نظر خود را تنها با فکر کردن به آن در گالری گوشی خود بیابید، بدون بلند کردن مداد طرحی جدید برای دکوراسیون آشپزخانه بکشید، تصویر یک غروب زیبا را که عکسی از آن ندارید، برای دوستان خود بفرستید. رایانهای که بتواند ذهن بشر را بخواند فواید بسیاری برای افراد عادی و چه رسد برای معلولین خواهد داشت. حال دانشمندان برای اولین بار الگوریتمی طراحی کردهاند که میتواند تصاویر مشاهده شده یا تخیل شده توسط انسان را تفسیر کرده و بسیار دقیق بازسازی کند. شاید برای بهرهبرداری عملی از این تکنولوژی، دههها زمان لازم باشد؛ اما حال پژوهشگران یک قدم به رویای ساخت سیستمی برای به تصویر کشیدن ظاهری آنچه در ذهن میگذرد، نزدیکتر شدهاند.
استفاده از الگوریتم برای رمزگشایی تصاویر ذهنی موضوع جدیدی نیست. از سال ۲۰۱۱، پژوهشگران توانستهاند، به کمک تطبیق فعالیت مغز با فعالیت ضبط شده به هنگام مشاهدهی تصاویر؛ کلیپ، عکس و حتی رویاها را به تصویر بکشند. اما این روشها محدودیتهای خاص خود را دارند: برخی توانایی تشخیص گسترهای محدودی را مانند چهره دارند و برخی نمیتوانند تصویر خود را بکشند بلکه باید از تصاویر و دستههای برنامهریزی شده مانند؛ شخص یا پرنده موردی انتخاب کنند. حال پروژهی جدید میتواند تصاویر مشاهده شده و حتی تصور شده را به تصویر بکشد.
برای دانستن آنکه شخص در حال مشاهده چه چیزی است، محققین از fMRI استفاده کردند، در این روش میزان جریان خون به عنوان متغیری برای فعالیت مغزی سنجیده میشود. ۳ نفر چندین مرتبه، به مشاهدهی بیش از ۱۰۰۰ تصویر پرداختند و محققین با رزولوشن ۲ میلیمتر، مراکز مربوط به بینایی را نقشهبرداری کردند. هدف آن بود که فعالیت واکنش به هر تصویر را (مثل پلنگ) سنجیده و در نهایت رایانه تصویری را نقاشی کند که همان فعالیت را در فرد برانگیزد.
اما به جای آنکه مرحله به مرحله تصاویر نقاشی شده را به فرد نشان دهند، نرمافزار شبیهساز مغز، شبکهی مغزی عمقی (Deep Neural Network, DNN) به همراه لایههای متعدد از عناصر سادهی پردازش، را طراحی کردند. یوکیاسو کامیتانی (Yukiasu Kamitani) محقق علوم عصبی دانشکاه کیوتو ژاپن و محقق ارشد این پروژه میگوید:
ما معتقدیم، شبکهی عصبی نمایانگر مناسبی برای پردازش مرتبهای مغز است. به کمک DNN اطلاعات را از سطوح مختلف سیستم بینایی مغز، بدست میآوریم.
از کنتراست معمولی نور گرفته تا محتوای معنیدار همچون؛ چهرهها.
تصاویر طراحی شده توسط سیستم (دو ردیف پایین)؛ تصویر نمایش داده شده (ردیف اول)
با استفاده از رمزگشا در DNN، پژوهشگران پاسخ مغز را به تصاویر ارائه دادند. در این صورت آنها نیازی به fMRI نداشتند. به هنگام حدس در مورد اینکه فرد چه چیز میبیند، تفسیر همچون الگو خواهد بود و اطلاعات حاصل از fMRI کنار گذاشته خواهد شد. سپس سیستم تصویری را طراحی خواهد کرد تا DNN را به گونهای تحریک کند که پاسخ ایجاد شده با الگوی قبل منطبق باشد. آزمون و خطای بسیاری لازم است تا درنهایت تصویر مورد نظر کشیده میشود. سیستم ابتدا با شکلی ساده آغاز میکند و به تدریج در طول ۲۰۰ مرتبه، تصویر طراحی شده را تصحیح میکند. برای بهتر شدن نتیجه، سیستم فعالیت DNN را با فعالیت DNN الگو مقایسه میکند.
برای آنکه نتیجهی کار دقیقتر باشد، محققین DGN (Deep generator network) را که الگوریتمی برای خلق تصاویر واقعی، بر اساس دادههای خود مییاشد را اضافه کردند. DGN تصاویر را برای آنکه بیشتر طبیعی جلوه بیابند، تصحیح میکند.
سپس، دانشمندان سعی داشتند تا ذهن افراد در حال تخیل تصاویر را بخوانند. این بار آنها مغز داوطلبین را به هنگام یادآوری اجسامی که پیش از آن نمایش داده شده بود اسکن کردند. اجسام نمایش داده شده شامل؛ ماهی، هواپیما و تصاویر سادهی رنگ آمیزی شده بود. این متد برای تصاویر عملکرد مطلوبی نداشت اما برای اشکال، تصاویر قابل تشخیصی را در ۸۳ درصد موارد خلق کرد.
دیگر محققین فعال در این حوزه، پروژه را جالب دانستهاند و مشتاق هستند بدانند تا چه حد نبود دقت در تصاویر خلق شده به وسیلهی رایانه، مربوط به محدودیتهای موجود در سنجش فعالیت مغز مربوط میشود و تا چه اندازه نشاندهندهی خطای تفسیر تصاویر توسط مغز هستند. با بهبود fMRI و دیگر تکنیکهای تصویربرداری و همچنین تصحیح الگوریتمها، شاید روزی بتوانیم به کمک تصاویر ذهنی با یکدیگر در ارتباط باشیم.