جمعیت پرندگان در سراسر جهان با سرعت نگران کننده ای در حال کاهش است، به طوری که تقریباً 48 درصد از گونه های پرندگان موجود شناخته شده یا مشکوک به کاهش جمعیت هستند. به عنوان مثال، ایالات متحده و کانادا از سال 1970 تاکنون 29 درصد تعداد پرندگان کمتری را گزارش کرده اند.
نظارت موثر بر جمعیت پرندگان برای توسعه راه حل هایی که حفاظت را ترویج می کنند ضروری است. نظارت به محققان این امکان را می دهد که شدت مشکل را برای جمعیت های خاص پرندگان بهتر درک کنند و ارزیابی کنند که آیا مداخلات موجود مؤثر است یا خیر. برای نظارت بر مقیاس، محققان پرندگان شروع به تجزیه و تحلیل اکوسیستم ها از راه دور با استفاده از ضبط صدای پرندگان به جای حضور فیزیکی از طریق نظارت صوتی غیرفعال کرده اند. محققان می توانند هزاران ساعت صدا را با دستگاه های ضبط از راه دور جمع آوری کنند و سپس از تکنیک های یادگیری ماشینی (ML) برای پردازش داده ها استفاده کنند. در حالی که این یک پیشرفت هیجانانگیز است، مدلهای ML موجود با دادههای صوتی اکوسیستم استوایی به دلیل تنوع بیشتر گونههای پرندگان و صداهای همپوشانی پرندگان با مشکل مواجه هستند.
برای درک کیفیت مدل در دنیای واقعی به داده های صوتی حاشیه نویسی نیاز است. با این حال، ایجاد مجموعه داده های حاشیه نویسی با کیفیت بالا – به ویژه برای مناطق با تنوع زیستی بالا – می تواند گران و خسته کننده باشد و اغلب به ده ها ساعت زمان تحلیلگر متخصص برای حاشیه نویسی یک ساعت صدا نیاز دارد. علاوه بر این، مجموعه دادههای مشروح موجود نادر هستند و فقط یک منطقه جغرافیایی کوچک، مانند Sapsucker Woods یا جنگلهای بارانی پرو را پوشش میدهند. هزاران اکوسیستم منحصر به فرد در جهان هنوز نیاز به تجزیه و تحلیل دارند.
در تلاش برای مقابله با این مشکل، در طول 3 سال گذشته، ما میزبان مسابقات ML در Kaggle با همکاری سازمانهای تخصصی متمرکز بر اکولوژیهای پر تاثیر بودهایم. در هر مسابقه، شرکتکنندگان با ساخت مدلهای ML مواجه میشوند که میتوانند صداها را از مجموعه دادههای خاص بومشناسی بگیرند و گونههای پرنده را بهطور دقیق با صدا شناسایی کنند. بهترین ورودی ها می توانند طبقه بندی کننده های قابل اعتماد را با داده های آموزشی محدود آموزش دهند. رقابت سال گذشته بر روی گونه های پرنده هاوایی متمرکز بود که برخی از در معرض خطرترین پرندگان در جهان هستند.
مسابقه BirdCLEF ML 2023
امسال ما با مرکز پرندهشناسی کورنل برای حفاظت از بیوآکوستیک و حالت طبیعی در آزمایشگاه کرنل همکاری کردیم تا میزبان مسابقه BirdCLEF ML 2023 با تمرکز بر پرندگان کنیایی باشیم. مجموع جوایز 50000 دلار است، مهلت ورود 17 می 2023 و آخرین مهلت ارسال 24 مه 2023 است. برای اطلاعات دقیق در مورد مجموعه داده مورد استفاده، جدول زمانی و قوانین به وب سایت مسابقه مراجعه کنید.
کنیا خانه بیش از 1000 گونه پرنده است که طیف وسیعی از اکوسیستم ها را پوشش می دهد، از ساواناهای ماسایی مارا گرفته تا جنگل های بارانی کاکامگا و حتی مناطق آلپی در کلیمانجارو و کوه کنیا. ردیابی این تعداد زیادی از گونه ها با ML می تواند چالش برانگیز باشد، به خصوص با حداقل داده های آموزشی موجود برای بسیاری از گونه ها.
NATURAL STATE در مناطق آزمایشی اطراف کوه شمالی کنیا کار می کند تا تأثیر رژیم های مختلف مدیریتی و وضعیت های تخریب را بر تنوع زیستی پرندگان در سیستم های مرتعی آزمایش کند. با استفاده از الگوریتم های ML توسعه یافته در محدوده این رقابت، NATURAL STATE قادر خواهد بود کارایی این رویکرد را در اندازه گیری موفقیت و مقرون به صرفه بودن پروژه های مرمت نشان دهد. علاوه بر این، توانایی نظارت مقرونبهصرفه تأثیر تلاشهای بازسازی بر تنوع زیستی به NATURAL STATE اجازه میدهد تا برخی از اولین مکانیسمهای مالی متمرکز بر تنوع زیستی را برای هدایت سرمایهگذاری بسیار مورد نیاز در بازسازی و حفاظت از این منظر آزمایش و ایجاد کند. افراد زیادی وابسته هستند این ابزارها برای مقیاس بندی مقرون به صرفه در فراتر از محدوده پروژه و دستیابی به چشم انداز خود برای بازسازی و حفاظت از سیاره در مقیاس ضروری هستند.
در رقابتهای قبلی، از معیارهایی مانند امتیاز F1 استفاده کردیم که مستلزم انتخاب آستانههای تشخیص خاص برای مدلها است. این نیاز به تلاش قابل توجهی دارد و ارزیابی کیفیت مدل اساسی را دشوار می کند: یک استراتژی آستانه گذاری بد در یک مدل خوب ممکن است عملکرد ضعیفی داشته باشد. امسال ما از معیار کیفیت مدل بدون آستانه استفاده می کنیم: دقت میانگین کلاس. این متریک خروجی هر گونه پرنده را به عنوان یک طبقهبندی باینری جداگانه در نظر میگیرد تا میانگین امتیاز AUC را برای هر یک محاسبه کند و سپس میانگین این امتیازها را محاسبه کند. تغییر به یک متریک کالیبره نشده باید با حذف نیاز به انتخاب یک آستانه تشخیص خاص، تمرکز بر کیفیت مدل اصلی را افزایش دهد.
چه طور باید شروع کرد
این اولین مسابقه Kaggle خواهد بود که در آن شرکت کنندگان می توانند از پلتفرم Kaggle Models که اخیراً راه اندازی شده است استفاده کنند که دسترسی به بیش از 2300 مدل عمومی و از پیش آموزش دیده از جمله بیشتر مدل های TensorFlow Hub را فراهم می کند. این منبع جدید ادغام عمیقی با بقیه Kaggle از جمله نوت بوک Kaggle، مجموعه داده ها و مسابقات خواهد داشت.
اگر علاقه مند به شرکت در این مسابقه هستید، یک مکان عالی برای شروع سریع این است که از مدل طبقهبندی کننده صدای پرنده منبع باز اخیر ما استفاده کنید که در Kaggle Models موجود است. این مدل جهانی تعبیه و طبقهبندی پرنده، logit خروجی را برای بیش از 10 هزار گونه پرنده فراهم میکند و همچنین بردارهای جاسازی را ایجاد میکند که میتوانند برای کارهای دیگر استفاده شوند. برای استفاده از مدل Bird Vocalization Classifier در Kaggle مراحل نشان داده شده در شکل زیر را دنبال کنید.
![]() |
برای امتحان مدل در Kaggle، به مدل اینجا بروید. 1) روی «نوت بوک جدید» کلیک کنید؛ 2) روی دکمه “Copy Code” کلیک کنید تا خطوط نمونه کد مورد نیاز برای بارگذاری مدل را کپی کنید. 3) روی دکمه «افزودن مدل» کلیک کنید تا این مدل را به عنوان منبع داده به نوت بوک خود اضافه کنید. و 4) کد نمونه را در ویرایشگر قرار دهید تا مدل بارگذاری شود. |
از طرف دیگر، دفترچه یادداشت شروع مسابقه شامل مدل و کد اضافی برای ایجاد آسانتر ارسال مسابقه است.
ما از جامعه پژوهشی دعوت می کنیم تا در مسابقه BirdCLEF شرکت کنند. در نتیجه این تلاش، ما امیدواریم که بررسی روند جمعیت پرندگان و ایجاد استراتژیهای موثر حفاظتی برای محققان و متخصصان حفاظت آسانتر باشد.
سپاسگزاریها
گردآوری این مجموعه داده های گسترده یک کار بزرگ بود و ما از بسیاری از کارشناسان حوزه که به جمع آوری و حاشیه نویسی دستی داده ها برای این مسابقه کمک کردند بسیار سپاسگزاریم. به طور خاص، مایلیم از (موسسات و مشارکت کنندگان فردی به ترتیب حروف الفبا) تشکر کنیم: جولی کاتیو و تام دنتون در تیم مغز، ماکسیمیلیان ایبل و استفان کال در دانشگاه فناوری کمنیتس، استفان کال و هولگر کلینک از مرکز کی لیزا یانگ برای حفاظت از بیوآکوستیک در آزمایشگاه پرندهشناسی کرنل، الکسیس جولی و هنینگ مولر در LifeCLEF، جاناتان بیلی از NATURAL STATE، هندریک ریرز، آلن جاکوت و فرانسیس چروتیچ از OekoFor GbR، و ویلم-پیر ولینگا از xeno-canto. همچنین از یان دیویس از آزمایشگاه پرندهشناسی کرنل تشکر میکنیم که به ما اجازه استفاده از تصویر قهرمان را در این پست داده است.