هدایت ML به سمت کاهش خطرات طبیعی از طریق همکاری – وبلاگ هوش مصنوعی گوگل

هدایت ML به سمت کاهش خطرات طبیعی از طریق همکاری – وبلاگ هوش مصنوعی گوگل

سیل شایع ترین نوع بلایای طبیعی است که سالانه بیش از 250 میلیون نفر را در سراسر جهان تحت تاثیر قرار می دهد. به‌عنوان بخشی از «پاسخ به بحران Google» و تلاش‌هایمان برای رسیدگی به بحران آب‌وهوایی، از مدل‌های یادگیری ماشینی (ML) برای پیش‌بینی سیل استفاده می‌کنیم تا به مردم مناطقی که قبل از وقوع فاجعه تحت تأثیر قرار گرفته‌اند، هشدار دهیم.

همکاری بین محققان در صنعت و دانشگاه برای تسریع پیشرفت به سمت اهداف متقابل در تحقیقات مرتبط با ML ضروری است. در واقع، رویکرد فعلی پیش‌بینی سیل مبتنی بر ML Google با همکاری محققان (1، 2) در دانشگاه یوهانس کپلر در وین، اتریش، دانشگاه آلاباما و دانشگاه عبری اورشلیم و دیگران توسعه یافته است.

امروز در مورد کارگاه آموزشی پیش‌بینی سیل اخیر با یادگیری ماشینی صحبت می‌کنیم، که تلاش‌هایی را برای گردهم‌آوری محققان از Google و سایر دانشگاه‌ها و سازمان‌ها برای ارتقای درک ما از رفتار و پیش‌بینی سیل، و ایجاد راه‌حل‌های قوی‌تر برای تشخیص زودهنگام و هشدار نشان می‌دهد. ما همچنین پروژه Caravan را مورد بحث قرار می دهیم که به ایجاد یک مخزن منبع باز برای داده های جریان جهانی کمک می کند و خود نمونه ای از همکاری است که از کارگاه قبلی Flood Forecasting Meets Learning Machine ایجاد شده است.

2023 یادگیری ماشینی با کارگاه پیش بینی سیل ملاقات می کند

چهارمین کارگاه سالانه Google Machine Learning Meets Forecasting Workshop در ژانویه برگزار شد. این کارگاه مجازی دو روزه میزبان بیش از 100 شرکت کننده از 32 دانشگاه، 20 سازمان دولتی و غیردولتی و 11 شرکت خصوصی بود. این انجمن فرصتی را برای هیدرولوژیست‌ها، دانشمندان کامپیوتر و امدادگران فراهم کرد تا در مورد چالش‌ها و تلاش‌ها در جهت بهبود پیش‌بینی سیل‌های جهانی، همگام شدن با پیشرفت‌های فن‌آوری پیشرفته و ادغام دانش حوزه در رویکردهای پیش‌بینی مبتنی بر ML بحث کنند. .

این رویداد شامل صحبت‌هایی از شش سخنران دعوت شده، یک سری جلسات بحث گروهی کوچک با تمرکز بر مدل‌سازی هیدرولوژیکی، نقشه‌برداری غرقاب، و موضوعات مرتبط با هشدار خطر، و همچنین ارائه‌ای توسط Google در FloodHub بود که دسترسی عمومی و رایگان به پیش‌بینی سیل Google، تا 7 روز قبل.

سخنرانان دعوت شده در این کارگاه عبارتند از:

ارائه ها را می توان در یوتیوب مشاهده کرد:

پیش‌بینی سیل 2023 با گفتگوهای یادگیری ماشینی روز 1 ملاقات می‌کند

پیش‌بینی سیل 2023 با بحث‌های یادگیری ماشینی روز 2 دیدار می‌کند

برخی از چالش‌های اصلی که در طول کارگاه برجسته شد، مربوط به ادغام علم فیزیکی و هیدرولوژیکی با ML برای کمک به ایجاد اعتماد و قابلیت اطمینان بود. پر کردن شکاف در مشاهدات مناطق غرق شده با مدل ها و داده های ماهواره ای. اندازه گیری مهارت و قابلیت اطمینان سیستم های هشدار سیل؛ و بهبود ارتباطات هشدارهای سیل به جمعیت های مختلف جهانی. علاوه بر این، شرکت کنندگان تاکید کردند که پرداختن به این چالش ها و سایر چالش ها مستلزم همکاری بین تعدادی از سازمان های مختلف و رشته های علمی است.

پروژه کاروان

یکی از چالش‌های اصلی در انجام تحقیقات موفق ML و ایجاد ابزارهای پیشرفته برای پیش‌بینی سیل، نیاز به مقادیر زیادی داده برای آموزش و ارزیابی محاسباتی پرهزینه است. امروزه، بسیاری از کشورها و سازمان‌ها داده‌های جریان جریان (معمولاً سطح آب یا نرخ جریان) را جمع‌آوری می‌کنند، اما استاندارد نشده یا در یک مخزن مرکزی نگهداری می‌شوند، که دسترسی محققان را دشوار می‌کند.

در طول کارگاه آموزشی پیش‌بینی سیل در سال 2019، گروهی از محققان نیاز به منبع باز، مخزن داده‌های جریان جهانی را شناسایی کردند و ایده‌هایی را در مورد استفاده از منابع محاسباتی رایگان از Google Earth Engine برای رسیدگی به چالش جمع‌آوری داده‌ها و جامعه پیش‌بینی سیل ایجاد کردند. دسترسی. پس از دو سال کار مشترک بین محققان گوگل، دانشکده جغرافیا در دانشگاه اکستر، موسسه یادگیری ماشین در دانشگاه یوهانس کپلر، و موسسه علوم جوی و آب و هوا در ETH زوریخ، پروژه کاروان ایجاد شد.

در “کاروان – مجموعه داده های جامعه جهانی برای هیدرولوژی نمونه های بزرگ” منتشر شده در داده های علمی طبیعت، پروژه را با جزئیات بیشتری شرح می دهیم. بر اساس یک مجموعه داده جهانی برای توسعه و آموزش مدل‌های هیدرولوژیکی (شکل زیر را ببینید)، کاروان اسکریپت‌های منبع باز Python را ارائه می‌کند که از آب و هوا و داده‌های جغرافیایی ضروری استفاده می‌کند که قبلاً در Google Earth Engine عمومی شده بود تا با داده‌های جریان جریانی که کاربران در آن آپلود می‌کنند مطابقت داشته باشد. مخزن این مخزن در ابتدا حاوی اطلاعات بیش از 13000 حوزه آبخیز در اروپای مرکزی، برزیل، شیلی، استرالیا، ایالات متحده، کانادا و مکزیک بود. علاوه بر این، از مشارکت‌های اجتماعی سازمان زمین‌شناسی دانمارک و گرینلند که شامل داده‌های جریان جریان از بیشتر حوزه‌های آبخیز دانمارک است، بهره برده است. هدف این است که به توسعه و رشد این مخزن ادامه دهیم تا محققان بتوانند به بیشتر داده های جریان جهانی دسترسی داشته باشند. برای اطلاعات بیشتر در مورد مشارکت در مجموعه داده Caravan، به [email protected] مراجعه کنید.

مکان 13000 گیج جریان در مجموعه داده کاروان و توزیع آن سنج ها در مناطق آب و هوایی جهانی GENS.

مسیر رو به جلو

گوگل قصد دارد به میزبانی این کارگاه ها ادامه دهد تا به گسترش و تعمیق همکاری بین صنعت و دانشگاه در توسعه مدل های هوش مصنوعی محیطی کمک کند. ما مشتاقانه منتظریم تا ببینیم چه پیشرفت هایی ممکن است از کارگاه اخیر حاصل شود. هیدرولوژیست ها و محققان علاقه مند به شرکت در کارگاه های آینده تشویق می شوند با [email protected] تماس بگیرند.