زمان فوق العاده هیجان انگیزی برای دانشمند شدن است. با پیشرفتهای شگفتانگیز در یادگیری ماشین (ML) و محاسبات کوانتومی، ما اکنون ابزارهای جدید قدرتمندی داریم که به ما امکان میدهد بر اساس کنجکاوی خود عمل کنیم، به روشهای جدید همکاری کنیم و بهشدت پیشرفت به سوی اکتشافات علمی را تسریع کنیم.
از هشت سال پیش که به Google Research ملحق شدم، این امتیاز را داشتم که بخشی از جامعه محققان با استعدادی باشم که شیفته استفاده از محاسبات پیشرفته برای جابجایی مرزهای آنچه در علم کاربردی ممکن است، باشم. تیم های ما در حال بررسی موضوعاتی در سراسر علوم فیزیکی و طبیعی هستند. بنابراین، برای پست وبلاگ امسال، میخواهم روی پیشرفتهای تأثیرگذاری که اخیراً در زمینههای زیستشناسی و فیزیک انجام دادهایم، از کمک به سازماندهی اطلاعات پروتئین و ژنومیک جهان برای سودمندی زندگی مردم تا بهبود درک ما از طبیعت تمرکز کنم. کیهان با کامپیوترهای کوانتومی ما از پتانسیل بالای این کار الهام گرفته ایم.
استفاده از یادگیری ماشینی برای باز کردن اسرار در زیست شناسی
بسیاری از محققان ما مجذوب پیچیدگی فوقالعاده زیستشناسی هستند، از اسرار مغز گرفته تا پتانسیل پروتئینها و ژنوم که زبان زندگی را رمزگذاری میکند. ما در کنار دانشمندان دیگر سازمانهای پیشرو در سراسر جهان برای مقابله با چالشهای مهم در زمینههای کانکتومیکس، پیشبینی عملکرد پروتئین، و ژنومیک کار کردهایم و نوآوریهای خود را برای جامعه علمی بزرگتر قابل دسترس و مفید میکنیم.
نوروبیولوژی
یکی از کاربردهای هیجانانگیز روشهای ML توسعهیافته توسط Google، کشف چگونگی حرکت اطلاعات از طریق مسیرهای عصبی در مغز گورخرماهی بود، که بینشی را در مورد نحوه رفتار ماهیها در رفتار اجتماعی مانند ازدحام کردن ارائه میدهد. با همکاری محققان موسسه هوش بیولوژیکی ماکس پلانک، ما توانستیم بخشی از مغز گورخرماهی را که با میکروسکوپ الکترونی سه بعدی تصویربرداری شده بود به صورت محاسباتی بازسازی کنیم – یک پیشرفت هیجان انگیز در استفاده از تصویربرداری و خطوط لوله محاسباتی برای ترسیم مدارهای عصبی در مغزهای کوچک. و یک گام دیگر رو به جلو در کمک های دیرینه ما در زمینه کانکتومیک.
![]() |
بازسازی مدار عصبی مغز یک لارو گورخرماهی، توسط موسسه ماکس پلانک برای هوش بیولوژیکی. |
پیشرفت های فنی لازم برای این کار حتی فراتر از علوم اعصاب کاربرد دارد. به عنوان مثال، برای پرداختن به دشواری کار با چنین مجموعه داده های ارتباطی بزرگی، TensorStore را توسعه داده و منتشر کردیم، یک کتابخانه منبع باز C++ و Python که برای ذخیره سازی و دستکاری اطلاعات طراحی شده است. nداده های بعدی ما مشتاقانه منتظریم تا ببینیم چگونه از آن در زمینه های دیگر برای ذخیره مجموعه داده های بزرگ استفاده می شود.
ما همچنین از ML استفاده میکنیم تا با مقایسه پردازش زبان انسان و مدلهای زبان عمیق خودبازگشت (DLM) به چگونگی عملکرد مغز انسانها مانند زبان، کمک کنیم. برای این مطالعه، با همکاری همکاران در دانشگاه پرینستون و دانشکده پزشکی گراسمن دانشگاه نیویورک، شرکتکنندگان به یک پادکست 30 دقیقهای گوش دادند در حالی که فعالیت مغز آنها با استفاده از الکتروکورتیکوگرافی ثبت شد. ضبطها نشان میدهند که مغز انسان و DLMها اصول محاسباتی برای پردازش زبان را به اشتراک میگذارند، از جمله پیشبینی مداوم کلمه بعدی، تکیه بر تعبیههای متنی، و محاسبه غافلگیری پس از شروع بر اساس تطابق کلمه (ما میتوانیم میزان شگفتانگیز بودن مغز انسان را با استفاده از آن اندازهگیری کنیم. کلمه، و آن سیگنال غافلگیرکننده را با میزان خوب پیشبینی کلمه توسط DLM مرتبط کنید). این نتایج بینش جدیدی در مورد پردازش زبان در مغز انسان ارائه میکند و نشان میدهد که DLMها میتوانند برای آشکار کردن بینشهای ارزشمند در مورد اساس عصبی زبان استفاده شوند.
بیوشیمی
ML همچنین به ما این امکان را داده است که پیشرفت های قابل توجهی در درک توالی های بیولوژیکی داشته باشیم. در سال 2022، ما از پیشرفتهای اخیر در یادگیری عمیق برای پیشبینی دقیق عملکرد پروتئین از توالیهای اسید آمینه خام استفاده کردیم. ما همچنین با همکاری نزدیک با موسسه بیوانفورماتیک اروپایی آزمایشگاه زیستشناسی مولکولی اروپا (EMBL-EBI) کار کردیم تا عملکرد مدل را به دقت ارزیابی کنیم و صدها میلیون حاشیهنویسی کاربردی را به پایگاههای داده پروتئین عمومی UniProt، Pfam/InterPro و MGnify اضافه کنیم. حاشیه نویسی انسانی پایگاه های داده پروتئینی می تواند یک فرآیند پر زحمت و کند باشد و روش های ML ما جهشی بزرگ را امکان پذیر کرد – برای مثال، افزایش تعداد حاشیه نویسی های Pfam با تعداد بیشتری نسبت به همه تلاش های دیگر در طول دهه گذشته. میلیونها دانشمند در سراسر جهان که هر ساله به این پایگاههای اطلاعاتی دسترسی دارند، اکنون میتوانند از حاشیهنویسیهای ما برای تحقیقات خود استفاده کنند.
![]() |
کمکهای Google Research به Pfam از نظر اندازه از همه تلاشهای توسعه دادهشده در پایگاه داده در دهه گذشته فراتر رفته است. |
اگرچه اولین پیش نویس ژنوم انسان در سال 2003 منتشر شد، اما به دلیل محدودیت های فنی در فناوری های توالی یابی ناقص و دارای شکاف های زیادی بود. در سال 2022، ما دستاوردهای قابل توجه کنسرسیوم تلومر-2- تلومر (T2T) را در حل این مناطق که قبلاً در دسترس نبودند – از جمله پنج بازوی کروموزوم کامل و نزدیک به 200 میلیون جفت پایه از توالیهای جدید DNA – که برای سؤالات انسانی جالب و مهم هستند، جشن گرفتیم. زیست شناسی، تکامل و بیماری. فراخوان دهنده نوع ژنومیک منبع باز ما، DeepVariant، یکی از ابزارهایی بود که کنسرسیوم T2T برای آماده کردن انتشار یک توالی کامل 3.055 میلیارد جفت پایه از یک ژنوم انسانی استفاده کرد. کنسرسیوم T2T همچنین از روش منبع باز جدیدتر DeepConsensus ما استفاده می کند، که تصحیح خطای دستگاه را برای ابزارهای توالی خوانی طولانی مدت Pacific Biosciences در جدیدترین تحقیقات خود در مورد منابع پان ژنوم جامعی که می تواند وسعت تنوع ژنتیکی انسان را نشان دهد، ارائه می دهد.
استفاده از محاسبات کوانتومی برای اکتشافات جدید فیزیک
وقتی نوبت به اکتشافات علمی می رسد، محاسبات کوانتومی هنوز در مراحل ابتدایی است، اما پتانسیل زیادی دارد. ما در حال بررسی راههایی برای ارتقای قابلیتهای محاسبات کوانتومی هستیم تا بتواند به ابزاری برای اکتشافات و پیشرفتهای علمی تبدیل شود. با همکاری فیزیکدانان از سراسر جهان، ما همچنین شروع به استفاده از رایانه های کوانتومی موجود خود برای ایجاد آزمایش های جدید جالب در فیزیک کرده ایم.
به عنوان نمونه ای از این آزمایش ها، مشکلی را در نظر بگیرید که در آن یک حسگر چیزی را اندازه گیری می کند، و سپس یک کامپیوتر داده های حسگر را پردازش می کند. به طور سنتی، این بدان معنی است که داده های حسگر به عنوان اطلاعات کلاسیک در رایانه های ما پردازش می شوند. در عوض، یک ایده در محاسبات کوانتومی پردازش مستقیم داده های کوانتومی از حسگرها است. تغذیه دادهها از حسگرهای کوانتومی به طور مستقیم به الگوریتمهای کوانتومی بدون انجام اندازهگیریهای کلاسیک ممکن است مزیت بزرگی ایجاد کند. در مقاله اخیر Science که با همکاری محققان چندین دانشگاه نوشته شده است، نشان میدهیم که محاسبات کوانتومی میتواند اطلاعات را از آزمایشهای کمتری نسبت به محاسبات کلاسیک استخراج کند، تا زمانی که کامپیوتر کوانتومی مستقیماً به حسگرهای کوانتومی جفت شده باشد و یک الگوریتم یادگیری را اجرا کند. این “یادگیری ماشین کوانتومی” می تواند مزیت نمایی در اندازه مجموعه داده، حتی با کامپیوترهای کوانتومی در مقیاس متوسط امروزی، ایجاد کند. از آنجایی که داده های تجربی اغلب عامل محدود کننده اکتشافات علمی هستند، ML کوانتومی این پتانسیل را دارد که قدرت عظیم رایانه های کوانتومی را برای دانشمندان باز کند. حتی بهتر از آن، بینشهای حاصل از این کار برای یادگیری خروجی محاسبات کوانتومی، مانند خروجی شبیهسازیهای کوانتومی که ممکن است استخراج آنها دشوار باشد، نیز قابل استفاده است.
حتی بدون ML کوانتومی، یک کاربرد قدرتمند رایانههای کوانتومی، کاوش آزمایشی سیستمهای کوانتومی است که مشاهده یا شبیهسازی آنها غیرممکن است. در سال 2022، تیم هوش مصنوعی کوانتومی از این روش برای مشاهده اولین شواهد تجربی از فوتونهای مایکروویو متعدد در حالت محدود با استفاده از کیوبیتهای ابررسانا استفاده کرد. فوتونها معمولاً با یکدیگر برهمکنش نمیکنند و به عنصر غیرخطی اضافی نیاز دارند تا باعث برهمکنش آنها شود. نتایج شبیهسازیهای کامپیوتری کوانتومی ما از این برهمکنشها ما را شگفتزده کرد – ما فکر میکردیم که وجود این حالتهای محدود به شرایط شکننده بستگی دارد، اما در عوض متوجه شدیم که آنها حتی در برابر اغتشاشات نسبتاً قوی که اعمال میکنیم، قوی هستند.
![]() |
احتمال اشغال در مقابل گام زمانی گسسته برای حالت های محدود به فوتون n. مشاهده می کنیم که اکثر فوتون ها (رنگ های تیره تر) به هم متصل می مانند. |
با توجه به موفقیتهای اولیهای که در به کارگیری محاسبات کوانتومی برای دستیابی به پیشرفتهای فیزیک داشتهایم، امیدواریم که این فناوری بتواند اکتشافات پیشگامانهای را در آینده که میتواند تأثیر اجتماعی مهمی مانند ایجاد ترانزیستور یا GPS داشته باشد، ممکن کند. آینده محاسبات کوانتومی به عنوان یک ابزار علمی هیجان انگیز است!
سپاسگزاریها
میخواهم از همه کسانی که روی پیشرفتهای شرحدادهشده در این پست سخت کار کردند، از جمله تیمهای Google Applied Sciences، Quantum AI، Genomics و Brain و همکارانشان در سرتاسر Google Research و خارج از آن، تشکر کنم. در نهایت، مایلم از بسیاری از کارمندان Google که در نوشتن این پست بازخورد ارائه کردند، از جمله لیزی دورفمن، اریکا برند، الیز کلیمن، آبه آسفاو، ویرن جین، لوسی کولول، اندرو کارول، آریل گلدشتاین و شارینا چو تشکر کنم.
بالا
Google Research، 2022 و فراتر از آن
این هفتمین پست وبلاگ در مجموعه “Google Research، 2022 & Beyond” بود. سایر پست های این مجموعه در جدول زیر آمده است:
* مقالات پس از انتشار لینک خواهند شد. |