نقشه برداری چندلایه بافت مغز از طریق آموزش متضاد هدایت شده تقسیم بندی – وبلاگ هوش مصنوعی گوگل

نقشه‌برداری از فعالیت‌های سیم‌کشی و شلیک مغز انسان برای رمزگشایی نحوه تفکر ما – اینکه چگونه جهان را حس می‌کنیم، یاد می‌گیریم، تصمیم می‌گیریم، به یاد می‌آوریم و خلق می‌کنیم – و همچنین مسائلی که ممکن است در بیماری یا اختلال عملکرد مغز ایجاد شود، اساسی است. تلاش‌های اخیر نقشه‌های مغزی در دسترس عموم (نقشه‌برداری سه‌بعدی با وضوح بالا از سلول‌های مغز و اتصالات آن‌ها) را با کیفیت و مقیاس بی‌سابقه، مانند H01، بازسازی دیجیتال 1.4 پتابایتی نمونه‌ای از بافت مغز انسان از هاروارد/گوگل ارائه کرده است. و مجموعه داده قشر موش میلیمتری مکعبی از همکاران ما در کنسرسیوم MICRONS.

برای تفسیر نقشه‌های مغزی در این مقیاس به لایه‌های متعددی از تجزیه و تحلیل، از جمله شناسایی اتصالات سیناپسی، بخش‌های فرعی سلولی و انواع سلول نیاز است. یادگیری ماشین و فن‌آوری بینایی کامپیوتری نقشی اساسی در فعال‌سازی این تحلیل‌ها ایفا کرده‌اند، اما استقرار چنین سیستم‌هایی هنوز یک فرآیند پرزحمت است و به ساعت‌ها برچسب‌گذاری دستی حقیقت زمینی توسط حاشیه‌نویسان خبره و منابع محاسباتی قابل توجهی نیاز دارد. علاوه بر این، برخی از وظایف مهم، مانند شناسایی نوع سلول تنها از یک قطعه کوچک آکسون یا دندریت، می تواند حتی برای متخصصان انسانی چالش برانگیز باشد و هنوز به طور موثر خودکار نشده است.

امروز، در «نقشه‌های چندلایه نوروپیل با یادگیری متضاد هدایت‌شده با تقسیم‌بندی»، آموزش تضادهای هدایت‌شده با تقسیم‌بندی (SegCLR)، روشی برای آموزش نمایش‌های غنی و عمومی از مورفولوژی سلولی (شکل سلول) و فراساختار را اعلام می‌کنیم. (ساختار داخلی سلول) بدون تلاش دستی پر زحمت. SegCLR نمایش‌های برداری فشرده (یعنی جاسازی‌ها) را تولید می‌کند که در کارهای مختلف پایین‌دستی (مثلاً طبقه‌بندی محلی بخش‌های فرعی سلولی، خوشه‌بندی بدون نظارت) قابل اجرا هستند و حتی می‌توانند انواع سلول‌ها را فقط از قطعات کوچک یک سلول شناسایی کنند. ما SegCLR را بر روی مجموعه داده قشر انسان H01 و مجموعه داده قشر موش MIrONS آموزش دادیم و بردارهای تعبیه شده را که در مجموع حدود 8 میلیارد است، برای محققان منتشر می کنیم.

از سلول‌های مغزی که از یک بلوک سه‌بعدی بافت جدا شده‌اند، جاسازی‌های SegCLR مورفولوژی و فراساختار سلولی را به تصویر می‌کشند و می‌توانند برای تشخیص زیربخش‌های سلولی (مثلاً ستون فقرات دندریتیک در مقابل شفت دندریت) یا انواع سلول (مانند سلول هرمی در مقابل سلول میکروگلیا) استفاده شوند.

معرف مورفولوژی و فراساختار سلولی

SegCLR بر پیشرفت های اخیر در یادگیری متضاد خود نظارتی استوار است. ما از یک معماری شبکه عمیق استاندارد برای رمزگذاری ورودی‌هایی استفاده می‌کنیم که شامل بلوک‌های 3 بعدی محلی از داده‌های میکروسکوپ الکترونی (حدود 4 میکرومتر در یک طرف) در بردارهای تعبیه‌شده 64 بعدی است. شبکه از طریق از دست دادن کنتراست برای نگاشت ورودی های مرتبط معنایی به مختصات مشابه در فضای تعبیه آموزش داده شده است. این به راه‌اندازی محبوب SimCLR نزدیک است، با این تفاوت که ما همچنین به قطعه‌بندی نمونه‌ای از حجم (ردیابی سلول‌ها و تکه‌های سلولی) نیاز داریم که به دو روش مهم استفاده می‌کنیم.

اول، داده های میکروسکوپ الکترونی سه بعدی ورودی به طور صریح با تقسیم بندی پوشانده می شود و شبکه را مجبور می کند که فقط بر روی سلول مرکزی در هر بلوک تمرکز کند. دوم، ما از تقسیم‌بندی استفاده می‌کنیم تا به طور خودکار تعریف کنیم که کدام ورودی‌ها از نظر معنایی مرتبط هستند: جفت‌های مثبت برای از دست دادن متضاد از مکان‌های نزدیک در همان سلول تقسیم‌بندی شده ترسیم می‌شوند و برای داشتن نمایش‌های مشابه آموزش داده می‌شوند، در حالی که ورودی‌های گرفته‌شده از سلول‌های مختلف برای داشتن نمایش‌های متفاوت آموزش داده می‌شوند. . نکته مهم، تقسیم‌بندی‌های خودکار در دسترس عموم از مجموعه داده‌های انسان و موش برای آموزش SegCLR بدون نیاز به بررسی و تصحیح سخت توسط متخصصان انسانی به اندازه کافی دقیق بود.

SegCLR برای نشان دادن ویژگی های سلولی غنی بدون برچسب گذاری دستی آموزش دیده است. بالا: معماری SegCLR نماهای سه بعدی ماسک شده محلی داده های میکروسکوپ الکترونی را به بردارهای جاسازی شده نگاشت می کند. فقط حجم میکروسکوپ و قطعه‌بندی نمونه خودکار پیش‌نویس مورد نیاز است. پایین: تقسیم بندی همچنین برای تعریف جفت های مثال مثبت در مقابل منفی استفاده می شود که نمایش های آنها به هم نزدیکتر شده اند (موارد مثبت، فلش های آبی) یا دورتر از هم (منفی ها، فلش های قرمز) در حین تمرین

کاهش الزامات آموزش حاشیه نویسی با سه مرتبه بزرگی

جاسازی‌های SegCLR را می‌توان در تنظیمات پایین‌دستی مختلف، چه تحت نظارت (مثلاً طبقه‌بندی‌کننده‌های آموزشی) یا بدون نظارت (مانند خوشه‌بندی یا بازیابی تصویر مبتنی بر محتوا) استفاده کرد. در تنظیمات نظارت شده، تعبیه‌ها آموزش طبقه‌بندی‌کننده‌ها را ساده می‌کنند و می‌توانند الزامات برچسب‌گذاری حقیقت را تا حد زیادی کاهش دهند. برای مثال، ما دریافتیم که برای شناسایی زیرمجموعه‌های سلولی (آکسون، دندریت، سوما و غیره) یک طبقه‌بندی‌کننده خطی ساده که در بالای جاسازی‌های SegCLR آموزش داده شده، بهتر از یک شبکه عمیق کاملاً نظارت شده آموزش‌دیده در همان کار عمل می‌کند، در حالی که تنها از حدود هزار نمونه برچسب‌گذاری شده استفاده می‌کند. به جای میلیون ها

ما عملکرد طبقه‌بندی را برای زیرمجموعه‌های آکسون، دندریت، سوما و آستروسیت در مجموعه داده قشر انسان از طریق میانگین امتیاز F1 ارزیابی کردیم، در حالی که تعداد نمونه‌های آموزشی مورد استفاده را تغییر دادیم. طبقه‌بندی‌کننده‌های خطی آموزش‌دیده‌شده در بالای جاسازی‌های SegCLR با عملکرد طبقه‌بندی‌کننده عمیق کاملاً نظارت‌شده (خط افقی) مطابقت داشتند یا از آن فراتر رفتند، در حالی که از بخشی از داده‌های آموزشی استفاده می‌کردند.

تمایز انواع سلول، حتی از قطعات کوچک

تمایز انواع مختلف سلول گام مهمی در جهت درک چگونگی رشد و عملکرد مدارهای مغزی در سلامت و بیماری است. متخصصان انسانی می توانند یاد بگیرند که برخی از انواع سلول های قشر مغز را بر اساس ویژگی های مورفولوژیکی شناسایی کنند، اما تایپ سلولی دستی کار دشواری است و موارد مبهم رایج است. تایپ سلولی نیز زمانی دشوارتر می شود که تنها قطعات کوچکی از سلول ها در دسترس باشند، که برای بسیاری از سلول ها در بازسازی های ارتباطی فعلی رایج است.

متخصصان انسانی به صورت دستی انواع سلول ها را برای تعداد کمی از سلول های تصحیح شده در هر مجموعه داده برچسب گذاری کردند. در مجموعه داده قشر موش، کارشناسان شش نوع نورون (بالا) و چهار نوع گلیا (نشان داده نشده). در مجموعه داده قشر انسان، کارشناسان دو نوع نورون (نشان داده نشده) و چهار نوع گلیا (نشان داده نشده) را برچسب گذاری کردند.پایین). (ردیف ها نباید با یکدیگر مقیاس شوند.)

ما دریافتیم که SegCLR به دقت انواع سلول های انسان و موش را حتی برای قطعات کوچک استنباط می کند. قبل از طبقه‌بندی، ما جاسازی‌ها را در هر سلول در یک فاصله تجمعی تعیین شده، که به عنوان شعاع از یک نقطه مرکزی تعریف می‌شود، جمع‌آوری و میانگین‌گیری کردیم. ما دریافتیم که انواع سلول‌های قشر انسان را می‌توان با دقت بالایی برای شعاع‌های تجمعی به کوچکی 10 میکرومتر، حتی برای انواعی که تشخیص آن‌ها برای متخصصان دشوار است، مانند میکروگلیا (MGC) در مقابل سلول‌های پیش‌ساز اولیگودندروسیت (OPC) شناسایی کرد.

SegCLR می تواند انواع سلول ها را حتی از قطعات کوچک طبقه بندی کند. ترک کرد: عملکرد طبقه‌بندی بر روی شش نوع سلول قشر انسان برای مدل‌های کم عمق ResNet آموزش‌دیده بر روی جاسازی‌های SegCLR برای قطعات سلولی با اندازه‌های مختلف. شعاع تجمع صفر مربوط به قطعات بسیار کوچک با تنها یک جاسازی است. عملکرد نوع سلولی برای قطعات با شعاع تجمع تنها 10 میکرومتر به دقت بالایی (0.938 میانگین امتیاز F1) می رسد.نقطه جعبه ای). درست: ماتریس آشفتگی طبقاتی در شعاع تجمع 10 میکرومتری. سایه تیره تر در امتداد مورب نشان می دهد که انواع سلول های پیش بینی شده در اکثر موارد با برچسب های متخصص مطابقت دارند. AC: آستروسیت؛ MGC: سلول میکروگلیا. OGC: سلول الیگودندروسیت. OPC: سلول پیش ساز الیگودندروسیت. E: نورون تحریکی. I: نورون مهاری.

در قشر موش، ده نوع سلول را می توان با دقت بالا در شعاع تجمع 25 میکرومتر تشخیص داد.

ترک کرد: عملکرد طبقه بندی بر روی ده نوع سلول قشر موش به 0.832 میانگین امتیاز F1 برای قطعات با شعاع تجمع 25 میکرومتر می رسد.نقطه جعبه ای). درست: ماتریس سردرگمی طبقاتی در شعاع تجمع 25 میکرومتری. جعبه‌ها گروه‌های وسیع (گلیا، نورون‌های تحریکی و نورون‌های بازدارنده) را نشان می‌دهند. P: سلول هرمی. THLC: آکسون تالاموکورتیکال. قبل از میلاد: سلول سبد; BPC: سلول دوقطبی. MC: سلول مارتینوتی; NGC: سلول نوروگلیافرم.

در کاربردهای دیگر نوع سلول، ما از خوشه‌بندی بدون نظارت تعبیه‌های SegCLR برای نشان دادن زیرگروه‌های عصبی بیشتر استفاده کردیم و نشان دادیم که چگونه می‌توان از تخمین عدم قطعیت برای محدود کردن طبقه‌بندی به زیرمجموعه‌های با اطمینان بالا از مجموعه داده استفاده کرد، به عنوان مثال، زمانی که تنها چند نوع سلول دارای برچسب‌های متخصص هستند.

آشکارسازی الگوهای اتصال مغز

در نهایت، ما نشان دادیم که چگونه SegCLR می تواند برای تجزیه و تحلیل خودکار اتصالات مغز با تایپ سلولی شرکای سیناپسی سلول های بازسازی شده در سراسر مجموعه داده قشر موش استفاده شود. دانستن الگوهای اتصال بین انواع سلول های خاص برای تفسیر بازسازی های کانکتومیک در مقیاس بزرگ سیم کشی مغز اساسی است، اما این معمولاً به ردیابی دستی برای شناسایی انواع سلول های شریک نیاز دارد. با استفاده از SegCLR، یافته‌های اتصال مغز را تکرار کردیم که قبلاً بر ردیابی دستی فشرده تکیه می‌کردند، در حالی که مقیاس آن‌ها را از نظر تعداد سیناپس‌ها، انواع سلول‌ها و نواحی مغزی تحلیل‌شده گسترش دادیم. (برای جزئیات بیشتر به مقاله مراجعه کنید.)

تجزیه و تحلیل خودکار SegCLR اتصال مغز. بالا: نمونه ای از سلول های هرمی موش، با مکان های سیناپس با کد رنگی بر اساس طبقه بندی شریک سیناپسی به عنوان بازدارنده (آبی، تحریک کننده (قرمز، یا ناشناخته (سیاه). Inset جزئیات بالاتری از دندریت های سوما و پروگزیمال را نشان می دهد. پایینما شمارش کردیم که چند شریک سیناپسی بالادست به عنوان آکسون های تالاموکورتیکال طبقه بندی شدند که ورودی را از سیستم های حسی به قشر می آورند. ما دریافتیم که ورودی تالاموس عمدتاً به لایه L4 قشری، لایه ورودی قشر متعارف می‌رسد و ترجیحاً ناحیه بینایی اولیه V1 را هدف قرار می‌دهد تا مناطق بینایی بالاتر (HVA).

بعد چه می شود؟

SegCLR ویژگی‌های سلولی غنی را ثبت می‌کند و می‌تواند تجزیه و تحلیل‌های پایین‌دستی را در مقایسه با کار مستقیم با داده‌های تصویر خام و تقسیم‌بندی ساده‌تر کند. ما هیجان‌زده هستیم که ببینیم جامعه با استفاده از 8 میلیارد جاسازی که برای مجموعه داده‌های قشر انسان و موش منتشر می‌کنیم، چه چیزهایی می‌تواند کشف کند (کد دسترسی مثال؛ نماهای انسان و موش قابل مرور در Neuroglancer). SegCLR با کاهش داده‌های میکروسکوپی پیچیده به بازنمایی‌های گنجانده شده غنی و فشرده، راه‌های جدیدی را برای بینش بیولوژیکی باز می‌کند و ممکن است به عنوان پیوندی به روش‌های تکمیلی برای توصیف ابعاد بالا در سطوح سلولی و درون سلولی، مانند رونویسی‌های حل‌شده فضایی، عمل کند.