نحوه پیش بینی خرابی پمپ های آب در تانزانیا با استفاده از کتابخانه CatBoost

عکس پروفایل نویسنده

@ساگلتاراس بارانیوک

17 سال تجربه در ایجاد محصولات نرم افزاری در موقعیت های مختلف

داده کاوی و یک مدل ساده شروع کننده

این مقاله بر اساس رقابت است. در بزرگترین کشور شرق آفریقا ، با حدود 60 میلیون نفر ، نیمی از مردم به آب پاک دسترسی ندارند. میلیاردها دلار کمک خارجی برای مقابله با مشکل آب شیرین در اختیار کشور است. با این حال ، دولت نمی تواند این مشکل را حل کند. بخش قابل توجهی از پمپ های آب کاملاً از کار افتاده یا عملاً عملکردی ندارند. بقیه نیاز به تعمیر دارند.

داده ها دارای بسیاری از ویژگی های مرتبط با پمپ های آب است. نقاط تأمین آب به دو بخش عملکردی ، غیر عملکردی و عملکردی تقسیم شدند که نیاز به تعمیر داشتند. هدف از این مسابقه ساخت مدلی است که عملکرد نقاط تأمین آب را پیش بینی کند.

داده های مدل سازی دارای 59400 ردیف و 40 ستون بدون برچسب موجود در یک پرونده جداگانه است.

معیار مورد استفاده برای این مسابقه نرخ طبقه بندی است که درصد سطرهایی را محاسبه می کند که کلاس پیش بینی شده در ارسال با کلاس واقعی مجموعه آزمون مطابقت داشته باشد. حداکثر 1 و حداقل 0 است. هدف این است که حداکثر میزان طبقه بندی را بدست آوریم.

شرح دقیق هر ویژگی در مجموعه داده را می توان در …

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>