استفاده از ML برای تقویت تعامل با برنامه سلامت مادر و کودک در هند

در دسترس بودن گسترده تلفن‌های همراه، سازمان‌های غیرانتفاعی را قادر می‌سازد تا اطلاعات بهداشتی حیاتی را به موقع به ذینفعان خود ارائه دهند. در حالی که برنامه‌های کاربردی پیشرفته در گوشی‌های هوشمند امکان محتوای چندرسانه‌ای غنی‌تر و ارتباط دو طرفه بین ذینفعان و مربیان سلامت را فراهم می‌کنند، سرویس‌های پیام صوتی و متنی ساده‌تر می‌توانند در انتشار اطلاعات به جوامع بزرگ، به‌ویژه جوامعی که دسترسی محدود به اطلاعات و تلفن‌های هوشمند از آنها استفاده نمی‌شود، مؤثر باشد. آرمن1، یک غیر انتفاعی که فقط این کار را انجام می دهد، در هند مستقر است و ماموریت آن بهبود نتایج سلامت مادر و کودک در جوامع محروم است.

نمای کلی ARMMAN

یکی از برنامه هایی که توسط آنها اجرا می شود mMitra است که از پیام های صوتی خودکار برای ارائه به موقع اطلاعات مراقبت های پیشگیرانه به مادران باردار و تازه وارد در دوران بارداری و تا یک سال پس از تولد استفاده می کند. این پیام ها با توجه به سن حاملگی ذینفع تنظیم می شوند. نشان داده شده است که گوش دادن منظم به این پیام ها با بهبود نتایج رفتاری و سلامتی، مانند افزایش 17 درصدی نوزادان با وزن تولد سه برابر در پایان سال و افزایش 36 درصدی در زنانی که اهمیت مصرف قرص آهن را می دانند، ارتباط بالایی دارد. .

با این حال، یک چالش کلیدی که ARMMAN با آن روبرو بود این بود که حدود 40٪ از زنان به تدریج از مشارکت با این برنامه دست کشیدند. در حالی که می‌توان با تماس‌های سرویس زنده با زنان برای توضیح مزیت گوش دادن به پیام‌ها، این مشکل را کاهش داد، به دلیل محدود بودن کارکنان پشتیبانی نمی‌توان با همه افراد کم شنونده در برنامه تماس گرفت – این امر اهمیت اولویت‌بندی مؤثر افرادی را که چنین پیام‌هایی را دریافت می‌کنند برجسته می‌کند. تماس های خدماتی

در “مطالعه میدانی در استقرار راهزنان چند مسلح بی قرار: کمک به غیر انتفاعی در بهبود سلامت مادر و کودک”، منتشر شده در AAAI 2022، ما یک راه حل مبتنی بر ML را توصیف می کنیم که از داده های تاریخی سازمان غیردولتی استفاده می کند تا پیش بینی کند کدام ذینفع بیشترین سود را خواهند برد. از تماس های خدماتی ما چالش‌هایی را که با استقرار چنین سیستمی در دنیای واقعی در مقیاس بزرگ پیش می‌آیند بررسی می‌کنیم و سودمندی استقرار این مدل را در یک مطالعه واقعی شامل بیش از 23000 شرکت‌کننده نشان می‌دهیم. مدل افزایش شنوایی 30 درصدی را در مقایسه با استاندارد فعلی گروه مراقبت نشان داد.

زمینه
ما این مشکل بهینه‌سازی منابع را با استفاده از راهزن‌های چند مسلح بی‌قرار (RMABs) مدل‌سازی می‌کنیم، که برای کاربرد در چنین مشکلاتی در حوزه‌های بی‌شماری، از جمله مراقبت‌های بهداشتی، به خوبی مورد مطالعه قرار گرفته‌اند. یک RMAB شامل n بازوهایی که در آن هر بازو (به نمایندگی از یک ذینفع) با فرآیند تصمیم گیری مارکوف دو حالته (MDP) همراه است. هر MDP به عنوان یک مشکل دو حالته (وضعیت خوب یا بد، که در آن حالت خوب مربوط به میزان شنوایی بالا در هفته قبل است)، دو اقدام (مرتبط با اینکه آیا ذینفع برای دریافت تماس خدمات انتخاب شده است یا خیر) مدل می شود. علاوه بر این، هر MDP دارای یک تابع پاداش مرتبط (یعنی پاداش انباشته شده در یک وضعیت و عمل معین) و یک تابع انتقال است که احتمال جابجایی از یک حالت به حالت بعدی را تحت یک عمل معین، تحت شرط مارکوف که حالت بعدی نشان می‌دهد، دارد. فقط به حالت قبلی و عمل انجام شده روی آن بازو در آن مرحله زمانی بستگی دارد. عبارت بی قرار نشان می دهد که همه بازوها بدون توجه به عمل می توانند حالت را تغییر دهند.

وضعیت یک ذینفع ممکن است از خوب (درگیری بالا) به بد (درگیری کم) با مثال احتمالات انتقال غیرفعال و فعال که در ماتریس انتقال نشان داده شده است، تغییر کند.

توسعه مدل
در نهایت، مسئله RMAB به گونه‌ای مدل‌سازی می‌شود که در هر مرحله زمانی، داده می‌شود n کل بازوها، که ک برای به حداکثر رساندن پاداش (درگیر شدن با برنامه) باید روی بازوها عمل کرد (یعنی برای دریافت تماس سرویس انتخاب شود).

بنابراین، احتمال انتقال از یک حالت به حالت دیگر با (احتمال فعال) یا بدون (احتمال غیرفعال) دریافت تماس سرویس، پارامترهای مدل اساسی هستند که برای حل بهینه‌سازی فوق حیاتی هستند. برای تخمین این پارامترها، از داده‌های جمعیت‌شناختی ذینفعان جمع‌آوری‌شده در زمان ثبت‌نام توسط NGO، مانند سن، درآمد، تحصیلات، تعداد فرزندان و غیره و همچنین داده‌های شنوندگان گذشته استفاده می‌کنیم. استانداردهای حفظ حریم خصوصی داده های سازمان غیردولتی (بیشتر در زیر).

با این حال، حجم محدود تماس‌های سرویس، داده‌های مربوط به دریافت تماس سرویس را محدود می‌کند. برای کاهش این امر، از تکنیک‌های خوشه‌بندی برای یادگیری از مشاهدات جمعی ذینفعان در یک خوشه استفاده می‌کنیم و غلبه بر چالش نمونه‌های محدود به ازای هر ذینفع را قادر می‌سازیم.

به طور خاص، ما خوشه‌بندی را بر روی رفتارهای شنونده انجام می‌دهیم و سپس نقشه‌برداری را از ویژگی‌های جمعیتی به هر خوشه محاسبه می‌کنیم.

خوشه‌بندی بر روی داده‌های شنونده گذشته، خوشه‌هایی را با ذینفعان نشان می‌دهد که رفتار مشابهی دارند. سپس یک نقشه برداری از ویژگی های جمعیتی به خوشه ها را استنباط می کنیم.

این نقشه برداری مفید است زیرا وقتی یک ذینفع جدید ثبت نام می شود، ما فقط به اطلاعات جمعیت شناختی آنها دسترسی داریم و از الگوهای شنونده آنها اطلاعی نداریم، زیرا آنها هنوز فرصتی برای گوش دادن نداشته اند. با استفاده از نقشه برداری، می توانیم احتمالات انتقال را برای هر ذینفع جدیدی که در سیستم ثبت نام می کند استنتاج کنیم.

ما از چندین معیار کمی و کیفی برای استنتاج مجموعه بهینه خوشه‌ها استفاده کردیم و ترکیب‌های مختلف داده‌های آموزشی (فقط ویژگی‌های جمعیت‌شناختی، ویژگی‌ها به اضافه احتمال‌های غیرفعال، ویژگی‌ها به اضافه همه احتمالات، فقط احتمالات غیرفعال) را برای دستیابی به معنی‌دارترین خوشه‌ها بررسی کردیم. نماینده توزیع داده های اساسی است و دارای واریانس کم در اندازه های خوشه های فردی است.

مقایسه احتمالات انتقال غیرفعال به‌دست‌آمده از روش‌های مختلف خوشه‌بندی با تعداد خوشه‌ها س = 20 (نقاط قرمز) و 40 (نقاط سبز)، با استفاده از احتمالات انتقال غیرفعال حقیقت زمین (نقاط آبی). خوشه بندی بر اساس ویژگی ها + احتمالات غیرفعال (PPF) رفتارهای ذینفع متمایز تری را در فضای احتمال ثبت می کند.

خوشه‌بندی مزیت افزوده کاهش هزینه محاسباتی برای سازمان‌های غیردولتی با منابع محدود را دارد، زیرا بهینه‌سازی باید در سطح خوشه‌ای حل شود تا سطح فردی. در نهایت، حل RMAB به‌عنوان فضای P سخت شناخته می‌شود، بنابراین ما انتخاب می‌کنیم که بهینه‌سازی را با استفاده از رویکرد شاخص محبوب Whittle حل کنیم، که در نهایت یک رتبه‌بندی از ذینفعان بر اساس مزایای احتمالی آنها از دریافت تماس خدمات ارائه می‌دهد.

نتایج
ما مدل را در یک مطالعه دنیای واقعی شامل تقریباً 23000 ذینفع که به سه گروه تقسیم شدند، ارزیابی کردیم: گروه استاندارد مراقبت فعلی (CSOC)، گروه “Round Robin” (RR) و گروه RMAB. ذینفعان گروه CSOC از استاندارد اصلی مراقبت پیروی می کنند، جایی که هیچ تماس خدماتی از سوی سازمان های غیردولتی وجود ندارد. گروه RR سناریویی را نشان می‌دهد که در آن سازمان غیردولتی اغلب تماس‌های خدماتی را با استفاده از نظم سیستماتیک تنظیم می‌کند – ایده در اینجا این است که یک خط‌مشی به‌راحتی قابل اجرا داشته باشیم که به اندازه کافی از یک بخش متقاطع از ذینفعان خدمات ارائه می‌کند و می‌تواند در هفته بر اساس آن، افزایش یا کاهش یابد. منابع موجود (این رویکردی است که توسط سازمان غیردولتی در این مورد خاص استفاده می‌شود، اما این رویکرد ممکن است برای سازمان‌های غیردولتی مختلف متفاوت باشد). گروه RMAB تماس های سرویس را همانطور که توسط مدل RMAB پیش بینی شده بود دریافت می کند. همه ذینفعان در سه گروه همچنان به دریافت پیام‌های صوتی خودکار مستقل از تماس‌های سرویس ادامه می‌دهند.

توزیع خوشه های انتخاب شده برای تماس های خدماتی توسط RMAB و RR در هفته 1 (ترک کرد) و 2 (درست) به طور قابل توجهی متفاوت هستند. RMAB در انتخاب تنها چند خوشه با احتمال موفقیت امیدوارکننده بسیار استراتژیک است (آبی زیاد و قرمز کم است)، RR چنین انتخاب استراتژیکی را نشان نمی‌دهد.

در پایان هفت هفته، تماس‌های خدمات مبتنی بر RMAB منجر به بالاترین (و از نظر آماری معنی‌دار) کاهش در کاهش مشارکت تجمعی (32٪) در مقایسه با گروه CSOC شد.

نمودار نشان می دهد که از کاهش درگیری تجمعی در مقایسه با گروه کنترل جلوگیری شده است.
RMAB در مقابل CSOC RR در مقابل CSOC RMAB در مقابل RR
درصد کاهش در تعامل تجمعی کاهش می یابد 32.0٪ 5.2٪ 28.3٪
مقدار p 0.044 0.740 0.098

ملاحظات اخلاقی
یک هیئت اخلاقی در سازمان غیردولتی این مطالعه را بررسی کرد. ما اقدامات مهمی انجام دادیم تا اطمینان حاصل کنیم که رضایت شرکت‌کننده در هر مرحله از برنامه به زبانی که جامعه انتخاب می‌کند، درک و ضبط می‌شود. نظارت بر داده ها در دست سازمان غیردولتی است و فقط سازمان غیردولتی مجاز به اشتراک گذاری داده ها است. این کد به زودی در دسترس عموم قرار خواهد گرفت. خط لوله فقط از داده های ناشناس استفاده می کند و هیچ اطلاعات شناسایی شخصی (PII) در اختیار مدل ها قرار نمی گیرد. داده های حساس مانند کاست، مذهب و غیره توسط ARMMAN برای mMitra جمع آوری نمی شود. بنابراین، برای اطمینان از عادلانه بودن مدل، با کارشناسان بهداشت عمومی و میدانی کار کردیم تا اطمینان حاصل شود که سایر شاخص‌های وضعیت اجتماعی-اقتصادی اندازه‌گیری و به‌اندازه کافی مطابق شکل زیر ارزیابی شده‌اند.

توزیع بالاترین تحصیلات دریافتی (بالا) و درآمد ماهانه خانواده به روپیه هند (پایین) در گروهی که تماس های خدماتی را در مقایسه با کل جمعیت دریافت کرده اند.

نسبت ذینفعانی که در هر گروه درآمدی یک تماس خدمات زنده دریافت کرده‌اند به طور منطقی با نسبت در کل جمعیت مطابقت دارد. با این حال، تفاوت‌ها در دسته‌های درآمد پایین‌تر مشاهده می‌شود، جایی که مدل RMAB به نفع ذینفعان با درآمد پایین‌تر و ذینفعان بدون تحصیلات رسمی است. در نهایت، کارشناسان دامنه در ARMMAN عمیقاً در توسعه و آزمایش این سیستم مشارکت داشته اند و ورودی و نظارت مستمر را در تفسیر داده ها، مصرف داده ها و طراحی مدل ارائه کرده اند.

نتیجه گیری
پس از آزمایش کامل، NGO در حال حاضر این سیستم را برای برنامه ریزی تماس های خدماتی به صورت هفتگی مستقر کرده است. ما امیدواریم که این امر راه را برای استقرار بیشتر الگوریتم‌های ML برای تأثیرات اجتماعی در مشارکت با مؤسسات غیرانتفاعی در خدمت جمعیت‌هایی که تاکنون کمتر از ML سود برده‌اند، هموار کند. این اثر در Google for India 2021 نیز نمایش داده شد.

سپاسگزاریها
این کار بخشی از تلاش‌های هوش مصنوعی ما برای رفاه اجتماعی است و توسط Google Research، هند رهبری می‌شود. از همه همکارانمان در ARMMAN، Google Research India، Google.org، و دانشگاه Relations: Aparna Hegde، Neha Madhiwalla، Suresh Chaudhary، Aditya Mate، Lovish Madaan، Shresth Verma، Gargi Singh، Divy Thakkar سپاسگزاریم.


1ARMMAN برنامه‌های متعددی را برای ارائه اطلاعات مراقبت‌های پیشگیرانه به زنان در دوران بارداری و نوزادی اجرا می‌کند که آنها را قادر می‌سازد به دنبال مراقبت باشند، و همچنین برنامه‌هایی برای آموزش و حمایت کارکنان بهداشتی برای تشخیص و مدیریت به موقع شرایط پرخطر.