هنگامی که بیماری سرطان تشخیص داده می شود، یکی از مهم ترین مراحل بررسی تومور در زیر میکروسکوپ توسط پاتولوژیست ها برای تعیین مرحله سرطان و مشخص کردن تومور است. این اطلاعات برای درک پیش آگهی بالینی (به عنوان مثال، نتایج احتمالی بیمار) و برای تعیین مناسب ترین درمان، مانند انجام عمل جراحی به تنهایی در مقابل جراحی به همراه شیمی درمانی، مرکزی است. توسعه ابزارهای یادگیری ماشین (ML) در آسیب شناسی برای کمک به بررسی میکروسکوپی، یک حوزه تحقیقاتی قانع کننده با کاربردهای بالقوه بسیاری را نشان می دهد.
مطالعات قبلی نشان داده اند که ML می تواند تومورها را در تصاویر پاتولوژی به طور دقیق شناسایی و طبقه بندی کند و حتی با استفاده از آن می تواند پیش آگهی بیمار را پیش بینی کند. شناخته شده ویژگی های آسیب شناسی، مانند درجه انحراف ظاهر غده از حالت طبیعی. در حالی که این تلاش ها بر استفاده از ML برای شناسایی یا کمی کردن ویژگی های شناخته شده متمرکز است، رویکردهای جایگزین پتانسیل شناسایی را ارائه می دهند رمان امکانات. کشف ویژگی های جدید به نوبه خود می تواند با استخراج اطلاعاتی که هنوز در جریان کاری فعلی در نظر گرفته نشده است، پیش بینی سرطان و تصمیمات درمانی را برای بیماران بهبود بخشد.
امروز، میخواهیم پیشرفتهایی را که طی چند سال گذشته در جهت شناسایی ویژگیهای جدید سرطان کولورکتال با همکاری تیمهایی در دانشگاه پزشکی گراتس در اتریش و دانشگاه میلانو-بیکوکا (UNIMIB) در ایتالیا داشتهایم، به اشتراک بگذاریم. در زیر، ما چندین مرحله از کار را پوشش خواهیم داد: (1) آموزش مدلی برای پیشبینی پیشآگهی از تصاویر آسیبشناسی بدون مشخص کردن ویژگیهای مورد استفاده، به طوری که بتواند یاد بگیرد که چه ویژگیهایی مهم هستند. (2) بررسی آن مدل پیش آگهی با استفاده از تکنیک های توضیح پذیری. و (3) شناسایی یک ویژگی جدید و تایید ارتباط آن با پیش آگهی بیمار. ما این ویژگی را توصیف میکنیم و استفاده از آن توسط آسیبشناسان را در مقاله اخیر منتشر شده خود، «تایید آسیبشناس ویژگیهای یادگیری ماشینی برای طبقهبندی خطر سرطان کولون» ارزیابی میکنیم. با توجه به دانش ما، این اولین نمایشی است که کارشناسان پزشکی می توانند ویژگی های پیش آگهی جدیدی را از یادگیری ماشین بیاموزند، یک شروع امیدوارکننده برای آینده این الگوی “یادگیری از یادگیری عمیق”.
آموزش یک مدل پیش آگهی برای یادگیری چه ویژگی هایی مهم هستند
یک رویکرد بالقوه برای شناسایی ویژگیهای جدید، آموزش مدلهای ML برای پیشبینی مستقیم پیامدهای بیمار تنها با استفاده از تصاویر و دادههای نتیجه جفت شده است. این برخلاف مدلهای آموزشی برای پیشبینی برچسبهای حاشیهنویسی «واسطه» توسط انسان است شناخته شده ویژگی های پاتولوژیک و سپس استفاده از آن ویژگی ها برای پیش بینی نتایج.
کار اولیه توسط تیم ما امکان سنجی مدل های آموزشی را برای پیش بینی مستقیم پیش آگهی انواع سرطان با استفاده از مجموعه داده TCGA در دسترس عموم نشان داد. مشاهده این که برای برخی از انواع سرطان، پیشبینیهای این مدل پس از کنترل ویژگیهای پاتولوژیک و بالینی موجود، پیشآگهی بود، بهویژه هیجانانگیز بود. به همراه همکارانی از دانشگاه پزشکی گراتس و Biobank Graz، ما متعاقباً این کار را با استفاده از یک گروه بزرگ سرطان کولورکتال شناسایی نشده گسترش دادیم. تفسیر این پیشبینیهای مدل به مرحله بعدی جذاب تبدیل شد، اما تکنیکهای رایج تفسیرپذیری برای به کارگیری در این زمینه چالشبرانگیز بود و بینش روشنی ارائه نمیکرد.
تفسیر ویژگی های آموخته شده توسط مدل
برای بررسی ویژگی های مورد استفاده توسط مدل پیش آگهی، از مدل دوم (آموزش دیده برای شناسایی شباهت تصویر) برای برش خوشه ای استفاده کردیم. تکه ها از تصاویر آسیب شناسی بزرگ سپس از مدل پیش آگهی برای محاسبه میانگین امتیاز ریسک پیشبینیشده ML برای هر خوشه استفاده کردیم.
یک خوشه به دلیل میانگین امتیاز ریسک بالا (مرتبط با پیش آگهی ضعیف) و ظاهر بصری متمایزش متمایز بود. آسیب شناسان این تصاویر را شامل تومور با درجه بالا (یعنی کمترین شباهت به بافت طبیعی) در مجاورت بافت چربی (چربی) توصیف کردند، که ما را به لقب “ویژگی چربی تومور” (TAF) سوق داد. برای نمونه های دقیق از این ویژگی شکل بعدی را ببینید. تجزیه و تحلیل بیشتر نشان داد که مقدار نسبی TAF به خودی خود بسیار و به طور مستقل پیش آگهی بود.
یک مدل پیش آگهی ML برای پیشبینی بقای بیمار به طور مستقیم از تصاویر آسیبشناسی گیگاپیکسلی بدون حاشیهنویسی توسعه داده شد. یک مدل شباهت تصویر دوم برای خوشه بندی تکه های برش خورده تصاویر آسیب شناسی استفاده شد. مدل پیش آگهی برای محاسبه میانگین امتیاز ریسک پیش بینی شده توسط مدل برای هر خوشه استفاده شد. یک خوشه، که “ویژگی چربی تومور” (TAF) نامیده می شود، از نظر میانگین امتیاز خطر بالای آن (مرتبط با بقای ضعیف) و ظاهر بصری متمایز، برجسته بود. آسیب شناسان یاد گرفتند که TAF را شناسایی کنند و امتیاز پاتولوژیست برای TAF پیش آگهی بود. |
ترک کرد: اسلاید پاتولوژی H&E با یک نقشه حرارتی پوشانده شده که مکان های ویژگی چربی تومور (TAF) را نشان می دهد. مناطقی که با رنگ قرمز/نارنجی برجسته شده اند، در مقایسه با مناطقی که با رنگ سبز/آبی یا مناطقی که اصلا برجسته نشده اند، در مدل شباهت تصویر به احتمال زیاد TAF در نظر گرفته می شوند. درست: مجموعه ای از وصله های TAF در چندین مورد. |
اعتبار سنجی اینکه ویژگی یادگیری مدل می تواند توسط آسیب شناسان استفاده شود
این مطالعات نمونه قانعکنندهای از پتانسیل مدلهای ML برای پیشبینی نتایج بیمار و یک رویکرد روششناختی برای دستیابی به بینشهایی در مورد پیشبینیهای مدل ارائه کردند. با این حال، سؤالات جالبی وجود داشت که آیا آسیب شناسان می توانند ویژگی شناسایی شده توسط مدل را یاد بگیرند و امتیاز دهند و در عین حال ارزش پیش آگهی قابل اثبات را حفظ کنند.
در جدیدترین مقاله خود، ما با آسیب شناسان UNIMIB برای بررسی این سؤالات همکاری کردیم. آسیب شناسان UNIMIB با استفاده از تصاویر نمونه TAF از نشریه قبلی برای یادگیری و درک این ویژگی مورد علاقه، دستورالعمل های امتیازدهی را برای TAF ایجاد کردند. اگر TAF دیده نمیشد، مورد بهعنوان «غایب» نمرهگذاری میشد و اگر TAF مشاهده میشد، از دستههای «یک کانونی»، «چند کانونی» و «گسترده» برای نشان دادن کمیت نسبی استفاده میشد. مطالعه ما نشان داد که آسیب شناسان می توانند به طور تکرارپذیر TAF مشتق شده از ML را شناسایی کنند و امتیازدهی آنها برای TAF ارزش پیش آگهی آماری قابل توجهی را در یک مجموعه داده گذشته نگر مستقل ارائه می دهد. طبق دانش ما، این اولین نمایش آسیب شناسان است که برای شناسایی و امتیاز دادن به یک ویژگی آسیب شناسی خاص که در ابتدا با رویکرد مبتنی بر ML شناسایی شده بود، یاد می گیرند.
قرار دادن چیزها در زمینه: یادگیری از یادگیری عمیق به عنوان یک پارادایم
کار ما نمونه ای از افرادی است که «از یادگیری عمیق یاد می گیرند». در ML سنتی، مدلها از ویژگیهای مهندسی شده دستی میآموزند که از دانش دامنه موجود مطلع میشوند. اخیراً، در عصر یادگیری عمیق، ترکیبی از معماریهای مدل در مقیاس بزرگ، محاسبات و مجموعه دادهها، یادگیری مستقیم از دادههای خام را امکانپذیر کرده است، اما این اغلب به قیمت تفسیرپذیری انسان تمام میشود. کار ما استفاده از یادگیری عمیق را برای پیشبینی پیامدهای بیمار با روشهای تفسیرپذیر، برای استخراج دانش جدیدی که میتواند توسط آسیبشناسان اعمال شود، همراه میکند. ما این فرآیند را گام بعدی طبیعی در تکامل به کارگیری ML برای مشکلات پزشکی و علم میبینیم، که از استفاده از ML برای تقطیر دانش موجود انسانی به افرادی که از ML به عنوان ابزاری برای کشف دانش استفاده میکنند، حرکت میکند.
ML سنتی بر ویژگیهای مهندسی از دادههای خام با استفاده از دانش موجود انسانی متمرکز بود. یادگیری عمیق مدلها را قادر میسازد تا ویژگیها را مستقیماً از دادههای خام به قیمت تفسیرپذیری انسان یاد بگیرند. پیوند یادگیری عمیق با روشهای تفسیرپذیر، راهی برای گسترش مرزهای دانش علمی با یادگیری از یادگیری عمیق فراهم میکند. |
سپاسگزاریها
این کار بدون تلاش نویسندگان همکار وینچنزو لی امپریو، مارکوس پلاس، هیمو مولر، نیکولو تامینی، لوکا جیانوتی، نیکولا زوچینی، رابرت ریهس، گرگ اس. کورادو، دیل آر وبستر، لیلی اچ. پنگ ممکن نبود. ، پو-هسوان کامرون چن، ماریالوئیزا لاویترانو، دیوید اف. اشتاینر، کرت زاتلوکال، فابیو پاگنی. ما همچنین از حمایت Verily Life Sciences و تیمهای آسیبشناسی سلامت Google – بهویژه تیمو کولبرگر، یوننان کای، هونگوو وانگ، کونال ناگپال، کریگ مرمل، تریسیا براون، ایزابل فلامنت آوین و آنجلا لین قدردانی میکنیم. ما همچنین از بازخورد نسخه خطی آکینوری میتانی، روری سایرس و مایکل هاول و کمک تصویرسازی از ابی جونز قدردانی می کنیم. این کار همچنین بدون حمایت کریستین گولی، آندریاس هولزینگر، رابرت ریهس، فرح نادر، بانک زیستی گراتس، تلاش های تیم دیجیتالی سازی اسلایدها در دانشگاه پزشکی گراتس، مشارکت آسیب شناسانی که بررسی و حاشیه نویسی کردند، ممکن نبود. موارد در طول توسعه مدل، و تکنسین های تیم UNIMIB.