یادگیری عمیق بررسی سلول ها و ژن ها را تقویت می کند.
گفته میشود چشمها پنجرهای به روح هستند – اما محققان در گوگل آنها را به عنوان شاخصهای سلامت فردی نشان میبینند. غول فناوری از یادگیری عمیق استفاده میکند تا با تحلیل یک عکس از شبکیه فرد، فشار خون، سن و و وضعیت سیگار کشیدن فرد را پیشبینی کند. کامپیوترهای گوگل از موقعیت عروق خونی سرنخهایی جمعآوری میکند – و یک مطالعه اولیه نشان میدهد که دستگاهها میتوانند از این اطلاعات برای پیشبینی اینکه آیا کسی در معرض خطر حمله قلبی قرار دارد استفاده کنند.
این تحقیق متکی به یک شبکه عصبی به هم پیچیده (convolutional neural network )، یک نوع الگوریتم یادگیری عمیق است که تحلیل زیستشناسان از تصاویر را دگرگون میکند. دانشمندان از این رویکرد برای یافتن جهش در ژنوم و پیشبینی تغییرات در طرح سلولهای منفرد استفاده میکنند. روش گوگل که در ماه اوت در یک پیش نویس توصیف شده است، (R. Poplin et al. Preprint at https://arxiv.org/abs/1708.09843; 2017)، بخشی از موج جدید برنامههای کاربردی یادگیری عمیق است که پردازش تصویر را سادهتر و چندجانبهتر میکنند – و حتی میتواند پدیدههای بیولوژیک نادیده شده را شناسایی کند.
فیلیپ نلسون، مدیر مهندسی در تحقیقات گوگل در Mountain View، کالیفرنیا، میگوید: “قبلا استفاده از یادگیری ماشینی در بسیاری از زمینههای زیستشناسی غیرواقعبینانه بود” “اما کنون میتوانید – اما حتی هیجان انگیز تر این است که، ماشینها میتوانند چیزهایی را ببینند که ممکن است انسان ها پیش ازین ندیده باشند”
convolutional neural networks به کامپیوترها اجازه میدهند تا تصوير را به صورت موثر و جامع و بدون تقسیم کردن آن به قطعات پردازش کنند. این رویکرد که در سال ۲۰۱۲ در بخش تکنولوژی افتتاح شد، با پیشرفت در قدرت و ذخیرهسازی کامپیوتر ممکن شدهاست، برای مثال، فیس بوک از این نوع یادگیری عمیق برای شناسایی چهرهها در عکس استفاده میکند. اما دانشمندان بسیار تلاش کردند تا بتوانند شبکهها را در زیست شناسی اعمال کنند، بخشی از آن بهدلیل تفاوتهای فرهنگی بین زمینهها بود. دافنه کُلر، افسر ارشد محاسبات در کالیکو، یک شرکت بیوتکنولوژی در سانفرانسیسکو، کالیفرنیا که توسط والد گوگل، Alphabet حمایت میشود، میگوید: “گروهی از زیستشناسان باهوش را بیاورید و آنها را با دانشمندان کامپیوتری باهوش در یک اتاق قرار دهید و میبینید که آن ها با دو زبان مختلف یا یکدیگر صحبت میکنند و عقاید متفاوتی دارند.”
دانشمندان همچنین مجبور بودند شناسایی کنند که کدام نوع مطالعه میتواند با استفاده از شبکه هایی که باید قبل از اینکه بتوانند پیشبینیهای خود را شروع کنند با مجموعههای عظیمی از تصاویر آموزش ببینند، انجام شود. هنگامی که گوگل قصد داشت از یادگیری عمیق برای پیدا کردن جهش در ژنوم استفاده کند، دانشمندان مجبور به تبدیل رشته حروف DNA به تصاویری بودند که کامپیوترها میتوانستند شناسایی کنند. سپس آنها به شبکهی خود قطعاتی از DNA را آموزش دادند که با یک ژنوم مرجع همتراز شده بودند و جهشهایشان شناخته شده بود. نتیجه نهایی DeepVariant بود، ابزاری که در ماه دسامبر منتشر شد و میتواند تغییرات کوچک را در توالیهای DNA پیدا کند. در آزمایشات، DeepVariant عملکردی حداقل در سطح ابزارهای معمولی داشت.
زیستشناسان سلولی در موسسه علم سلولی Allen، سیاتل، واشنگتن، از convolutional neural networks استفاده میکنند تا تصاویر صاف و خاکستری از سلولها که با میکروسکوپ نوری گرفته شده است را به تصاویر سه بعدی تبدیل کنند که در آن برخی از ارگانلهای سلولی رنگی هستند. این رویکرد نیاز به رنگآمیزی سلولها را حذف میکند – فرایندی که نیاز به زمان بیشتر و یک آزمایشگاه پیشرفته دارد و میتواند به سلول آسیب برساند. در ماه گذشته، این گروه جزئیات روش پیشرفته ای را که میتواند شکل و مکان قطعات بیشتری از سلول را با استفاده از تنها تعداد کمی داده، نظیر مرزها و شکل کلی سلول، پیش بینی کند. (GR Johnson et al. Preprint at bioRxiv http: // doi .org / chwv؛ ۲۰۱۷).
آن کارپنتر، مدیر پلتفرم تصویربرداری در Broad Institute of MIT و هاروارد در کمبریج، ماساچوست، میگوید: “آنچه که اکنون مشاهده میکنید، یک تغییر بی سابقه است در اینکه چطور آموزش ماشینها میتواند انجام کارهای بیولوژیکی که باید با تصویربرداری انجام شود را انجام دهد.”. در سال ۲۰۱۵، تیم بینرشتهای او، شروع به پردازش سلولها را با استفاده از convolutional neural networks کرد. کارپنتر میگوید، در حال ُحاضر، در مرکز او ،شبکهها حدود ۱۵ درصد از دادههای تصویری را پردازش میکنند. او پیش بینی میکند که این روش در چند سال آینده تبدیل به رویکرد اصلی پردازش مرکز خواهد شد.
دیگران بیشتر از این موضوع هیجان زده هستند که، تجزیه و تحلیل تصاویر با convolutional neural networks میتواند به طور ناخواسته پدیدههای ظریف بیولوژیکی را نشان دهد و باعث شود برای بیولوژیستها سوالاتی پیش بیاید که ممکن است قبلا به آن فکر نکردهاند. “جالب ترین عبارت در علم”Eureka/ یافتم ” نیست، بلکه عبارت ” این عجیب است – چه اتفاقی دارد میافتد” است” نلسون میگوید.
ریک هورویتس، مدیر اجرایی موسسه آلن، میگوید: این کشفهای اتفاقی میتواند به پیشرفت در تحقیق در مورد بیماریها کمک کند. او میگوید اگر یادگیری عمیق بتواند نشانگرهای ظریف سرطان را در یک سلول منفرد نشان دهد، میتواند به محققان در دسته بندی پیشرفت تومورها کمک کند. این امر به نوبه خود موجب ایجاد فرضیههای جدید در مورد نحوه گسترش سرطان میشود.
دیگر دانشمندان machine learning در زیستشناسی دورنمای خود را بر روی مرزهای جدید قرار دادهاند، در حال حاضر convolutional neural networks برای پردازش تصویر استفاده میشوند. الکس ولف، یک زیست شناس محاسباتی در مرکز تحقیقاتی آلمان برای بهداشت محیط در Neuherberg میگوید: “تصویربرداری مهم است، اما شیمی و اطلاعات مولکولی هم مهم هستند .” ولف امیدوار است تا شبکههای عصبی را طوری تنظیم کند تا بتوانند بیان ژن را تحلیل کنند. او میگوید: “من فکر میکنم در چند سال آینده شاهد یک پیشرفت بسیار بزرگ خواهیم بود، که به متخصصان زیستشناسی اجازه میدهد تا شبکههای عصبی را بهطور گستردهتر بکار گیرند.”