تشخیص به کمک کامپیوتر برای غربالگری سرطان ریه

سرطان ریه با 1.8 میلیون مرگ در سال 2020، علت اصلی مرگ و میر ناشی از سرطان در جهان است. تشخیص دیرهنگام به طور چشمگیری شانس بقا را کاهش می دهد. نشان داده شده است که غربالگری سرطان ریه از طریق توموگرافی کامپیوتری (CT)، که تصویر سه بعدی دقیقی از ریه ها ارائه می دهد، با تشخیص زودتر علائم بالقوه سرطان، مرگ و میر را در جمعیت های پرخطر حداقل تا 20 درصد کاهش می دهد. در ایالات متحده، غربالگری شامل اسکن‌های سالانه است که در برخی کشورها یا موارد، اسکن‌های کم و بیش مکرر توصیه می‌شود.

گروه ویژه خدمات پیشگیرانه ایالات متحده اخیراً توصیه های غربالگری سرطان ریه را تقریباً 80 درصد گسترش داده است که انتظار می رود دسترسی به غربالگری زنان و گروه های اقلیت نژادی و قومی را افزایش دهد. با این حال، مثبت کاذب (به عنوان مثال، گزارش نادرست سرطان بالقوه در یک بیمار بدون سرطان) می تواند باعث اضطراب و منجر به اقدامات غیر ضروری برای بیماران شود، در حالی که هزینه های سیستم مراقبت های بهداشتی را افزایش می دهد. علاوه بر این، کارایی در غربالگری تعداد زیادی از افراد بسته به زیرساخت های مراقبت های بهداشتی و در دسترس بودن رادیولوژیست می تواند چالش برانگیز باشد.

در Google قبلاً مدل‌های یادگیری ماشینی (ML) را برای تشخیص سرطان ریه توسعه داده‌ایم و توانایی آنها را برای شناسایی و طبقه‌بندی خودکار مناطقی که علائم سرطان بالقوه را نشان می‌دهند، ارزیابی کرده‌ایم. نشان داده شده است که عملکرد با عملکرد متخصصان در تشخیص سرطان احتمالی قابل مقایسه است. در حالی که آنها به عملکرد بالایی دست یافته اند، انتقال موثر یافته ها در محیط های واقع گرایانه برای تحقق پتانسیل کامل آنها ضروری است.

برای این منظور، در “هوش مصنوعی کمکی در غربالگری سرطان ریه: یک مطالعه چند ملیتی گذشته نگر در ایالات متحده و ژاپن” منتشر شده در هوش مصنوعی رادیولوژی، ما بررسی می کنیم که چگونه مدل های ML می توانند به طور مؤثر یافته ها را به رادیولوژیست ها منتقل کنند. ما همچنین یک رابط کاربر محور قابل تعمیم را برای کمک به رادیولوژیست ها برای استفاده از چنین مدل هایی برای غربالگری سرطان ریه معرفی می کنیم. این سیستم تصویربرداری CT را به عنوان ورودی دریافت می‌کند و با استفاده از چهار دسته (بدون شک، احتمالاً خوش‌خیم، مشکوک، بسیار مشکوک) به همراه مناطق مورد نظر مربوطه، رتبه‌بندی سوء ظن سرطان را خروجی می‌کند. ما کاربرد سیستم را در بهبود عملکرد پزشک از طریق مطالعات خواننده تصادفی در ایالات متحده و ژاپن، با استفاده از سیستم‌های امتیازدهی سرطان محلی (Lung-RADSs V1.1 و Sendai Score) و بینندگان تصویری که تنظیمات واقعی را تقلید می‌کنند، ارزیابی می‌کنیم. ما دریافتیم که ویژگی خواننده با کمک مدل در هر دو مطالعه خواننده افزایش می یابد. برای تسریع پیشرفت در انجام مطالعات مشابه با مدل‌های ML، ما کد منبع باز برای پردازش تصاویر CT و تولید تصاویر سازگار با آرشیو تصاویر و سیستم ارتباطی (PACS) مورد استفاده توسط رادیولوژیست‌ها داریم.

توسعه یک رابط برای برقراری ارتباط با نتایج مدل

ادغام مدل‌های ML در جریان‌های کاری رادیولوژیست شامل درک تفاوت‌های ظریف و اهداف وظایف آنها برای حمایت معنادار از آنها است. در مورد غربالگری سرطان ریه، بیمارستان ها از دستورالعمل های مختلف کشور پیروی می کنند که به طور مرتب به روز می شوند. به عنوان مثال، در ایالات متحده، Lung-RADs V1.1 برای نشان دادن خطر ابتلا به سرطان ریه و توصیه‌های بعدی، یک امتیاز عددی الفا تعیین می‌کند.. هنگام ارزیابی بیماران، رادیولوژیست‌ها CT را در ایستگاه کاری خود بارگذاری می‌کنند تا مورد را بخوانند، ندول‌ها یا ضایعات ریه را پیدا کنند و دستورالعمل‌های مجموعه‌ای را برای تعیین تصمیم‌های بعدی اعمال کنند.

اولین قدم ما بهبود مدل‌های ML قبلی توسعه‌یافته از طریق داده‌های آموزشی اضافی و پیشرفت‌های معماری، از جمله توجه به خود بود. سپس، به‌جای هدف‌گیری دستورالعمل‌های خاص، روشی مکمل برای برقراری ارتباط با نتایج هوش مصنوعی مستقل از دستورالعمل‌ها یا نسخه‌های خاص آن‌ها آزمایش کردیم. به طور خاص، خروجی سیستم یک رتبه بندی سوء ظن و محلی سازی (مناطق مورد علاقه) را برای کاربر ارائه می دهد تا در ارتباط با دستورالعمل های خاص خود در نظر بگیرد. این رابط تصاویر خروجی را که مستقیماً با مطالعه CT مرتبط است تولید می کند و نیازی به تغییر در ایستگاه کاری کاربر ندارد. رادیولوژیست فقط باید مجموعه کوچکی از تصاویر اضافی را بررسی کند. هیچ تغییر دیگری در سیستم یا تعامل آنها با سیستم وجود ندارد.

نمونه ای از خروجی های سیستم غربالگری سرطان ریه کمکی. نتایج ارزیابی رادیولوژیست در محل حجم CT که ضایعه مشکوک در آن یافت می شود، مشاهده می شود. شک کلی در بالای تصاویر CT نمایش داده می شود. دایره ها ضایعات مشکوک را برجسته می کنند در حالی که مربع ها رندر همان ضایعه را از منظری متفاوت نشان می دهند که نمای ساژیتال نامیده می شود.

سیستم کمکی غربالگری سرطان ریه شامل 13 مدل است و دارای معماری سطح بالا مشابه سیستم انتها به انتها مورد استفاده در کار قبلی است. مدل‌ها با یکدیگر هماهنگ می‌شوند تا ابتدا ریه‌ها را تقسیم کنند، یک ارزیابی کلی به دست آورند، سه ناحیه مشکوک را پیدا کنند، سپس از اطلاعات برای تعیین رتبه‌بندی مشکوک به هر منطقه استفاده کنند. این سیستم با استفاده از موتور Google Kubernetes (GKE) در Google Cloud مستقر شد که تصاویر را می کشید، مدل های ML را اجرا می کرد و نتایج را ارائه می کرد. این امکان مقیاس پذیری را فراهم می کند و مستقیماً به سرورهایی که تصاویر در فروشگاه های DICOM ذخیره می شوند متصل می شود.

طرح کلی استقرار Google Cloud از سیستم کمکی غربالگری سرطان ریه و جریان فراخوانی جهت مولفه‌هایی که تصاویر را ارائه می‌کنند و نتایج را محاسبه می‌کنند. تصاویر با استفاده از خدمات Google Cloud به بیننده و سیستم ارائه می شوند. این سیستم بر روی موتور Google Kubernetes اجرا می‌شود که تصاویر را می‌کشد، پردازش می‌کند و دوباره در فروشگاه DICOM می‌نویسد.

مطالعه خواننده

برای ارزیابی کاربرد این سیستم در بهبود عملکرد بالینی، ما دو مطالعه خواننده (یعنی آزمایش‌هایی که برای ارزیابی عملکرد بالینی طراحی شده‌اند و عملکرد متخصص را با و بدون کمک یک فناوری مقایسه می‌کنند) با 12 رادیولوژیست با استفاده از سی‌تی اسکن‌های از قبل موجود و شناسایی نشده انجام دادیم. ما 627 مورد چالش برانگیز را به 6 رادیولوژیست مستقر در ایالات متحده و 6 رادیولوژیست مستقر در ژاپن ارائه کردیم. در تنظیم آزمایشی، خوانندگان به دو گروه تقسیم شدند که هر مورد را دو بار، با و بدون کمک مدل مطالعه کردند. از خوانندگان خواسته شد دستورالعمل‌های امتیازدهی را که معمولاً در عمل بالینی خود استفاده می‌کنند، اعمال کنند و ظن کلی خود به سرطان را برای هر مورد گزارش کنند. سپس نتایج پاسخ‌های خواننده را برای اندازه‌گیری تأثیر مدل بر گردش کار و تصمیم‌های آن‌ها مقایسه کردیم. امتیاز و سطح سوء ظن بر اساس نتایج واقعی سرطان افراد برای اندازه گیری حساسیت، ویژگی و سطح زیر مقادیر منحنی ROC (AUC) مورد قضاوت قرار گرفت. اینها با و بدون کمک مقایسه شدند.

یک مطالعه چند موردی چند خوان شامل هر مورد توسط هر خواننده دو بار، یک بار با کمک سیستم ML و یک بار بدون بررسی می شود. در این تجسم، یک خواننده ابتدا مجموعه A را بدون کمک بررسی می کند (آبی) و سپس با کمک (نارنجی) پس از یک دوره شستشو. یک گروه خواننده دوم با خواندن همان مجموعه موارد مجموعه A با کمک ابتدا مسیر مخالف را دنبال می کند. خوانندگان به طور تصادفی به این گروه ها تقسیم می شوند تا اثر سفارش حذف شود.

توانایی انجام این مطالعات با استفاده از رابط یکسان، قابلیت تعمیم آن را به سیستم‌های امتیازدهی سرطان کاملاً متفاوت، و تعمیم مدل و قابلیت کمکی به جمعیت‌های مختلف بیماران را برجسته می‌کند. نتایج مطالعه ما نشان داد که وقتی رادیولوژیست‌ها از این سیستم در ارزیابی بالینی خود استفاده کردند، توانایی افزایش یافته در شناسایی صحیح تصاویر ریه بدون یافته‌های عملی سرطان ریه (به عنوان مثال، اختصاصی) در مقایسه با زمانی که از سیستم کمکی استفاده نمی کردند، 5 تا 7 درصد مطلق. این به طور بالقوه به این معنی است که به ازای هر 15 تا 20 بیمار غربالگری شده، ممکن است یک نفر بتواند از روش های پیگیری غیرضروری اجتناب کند، در نتیجه اضطراب آنها و بار سیستم مراقبت های بهداشتی کاهش می یابد. این به نوبه خود می تواند به بهبود پایداری برنامه های غربالگری سرطان ریه کمک کند، به ویژه با واجد شرایط بودن افراد بیشتری برای غربالگری.

ویژگی خواننده با کمک مدل ML در مطالعات خواننده مستقر در ایالات متحده و ژاپن افزایش می یابد. ارزش‌های اختصاصی از نمرات خواننده از یافته‌های عملی (چیزی مشکوک پیدا شد) در مقابل هیچ یافته عملی، در مقایسه با پیامد واقعی سرطان فرد، به دست آمد. تحت کمک مدل، خوانندگان افراد کمتر مبتلا به سرطان را برای بازدیدهای بعدی علامت گذاری کردند. حساسیت برای افراد مثبت سرطان ثابت باقی ماند.

ترجمه این موضوع به تاثیر دنیای واقعی از طریق مشارکت

نتایج سیستم پتانسیل کمتری برای بازدیدهای بعدی، کاهش اضطراب و همچنین کاهش هزینه های کلی برای غربالگری سرطان ریه را نشان می دهد. در تلاش برای ترجمه این تحقیق به تأثیر بالینی در دنیای واقعی، ما با: DeepHealth، ارائه‌دهنده پیشرو انفورماتیک سلامت مبتنی بر هوش مصنوعی کار می‌کنیم. و Apollo Radiology International ارائه دهنده پیشرو خدمات رادیولوژی در هند برای کشف مسیرهایی برای ترکیب این سیستم در محصولات آینده است. علاوه بر این، ما به دنبال کمک به سایر محققان هستیم تا با استفاده از کد منبع باز مورد استفاده برای مطالعه خواننده و ترکیب بینش های شرح داده شده در این وبلاگ، به بهترین وجه ادغام نتایج مدل ML در جریان کار بالینی را مطالعه کنند. ما امیدواریم که این به تسریع محققان تصویربرداری پزشکی کمک کند که به دنبال انجام مطالعات خواننده برای مدل‌های هوش مصنوعی خود هستند و تحقیقات ترجمه‌ای را در این زمینه تسریع می‌کنند.

سپاسگزاریها

مشارکت کنندگان کلیدی این پروژه عبارتند از: کوربین کانینگهام، زید نابولسی، رایان نجفی، جی یانگ، چارلز لائو، جوزف آر. لدسام، ونکسینگ یه، دیگو آردیلا، اسکات ام. مک کینی، روری پیلگریم، هیرواکی سایتو، یاسوترو شیمامورا، موزیار یون ایتمادی. لیو، دیوید ملنیک، سانی یانسن، نادیا هارهن، دیوید پی. از Arnav Agharwal و Andrew Sellergren برای پشتیبانی منبع باز و Vivek Natarajan و Michael D. Howell برای بازخوردشان تشکر می کنیم. همچنین از رادیولوژیست‌هایی که این کار را با تلاش‌های خود برای تفسیر تصویر و حاشیه‌نویسی در طول مطالعه فعال کردند، و جانی وانگ و کارلی سامپسون برای هماهنگی مطالعات خوانندگان، قدردانی می‌کنیم.