رونمایی از قدرت توجه به خود برای پیش بینی هزینه حمل و نقل: آثار مرتبط

نویسندگان:

(1) P Aditya Sreekar، آمازون و این نویسندگان به طور مساوی به این کار کمک کردند {[email protected]};

(2) Sahil Verm، آمازون و این نویسندگان به طور مساوی در این کار کمک کردند {[email protected];}

(3) وارون ماداوان، موسسه فناوری هند، خاراگپور. کارهای انجام شده در حین کارآموزی در آمازون {[email protected]};

(4) آبیشک پرساد، آمازون {[email protected]}.

الگوریتم های مبتنی بر درخت به طور گسترده در یادگیری ماشین برای داده های جدولی استفاده می شوند. درخت‌های تصمیم به‌طور بازگشتی داده‌ها را بر اساس صفحات فوق‌العاده هم‌تراز با محور به بخش‌های متعدد تقسیم می‌کنند (هستی و همکاران، 2009). جنگل‌های تصادفی (RF) (Breiman، 2001) و درختان تصمیم تقویت‌شده گرادیان (GBDT) (فریدمن، 2001) متداول‌ترین مجموعه‌های درختی هستند که مورد استفاده قرار می‌گیرند. RF چندین درخت تصمیم را بر روی زیر مجموعه‌های تصادفی داده‌ها برازش می‌کند و پیش‌بینی‌ها را میانگین/نظرسنجی می‌کند تا ویژگی بیش‌برازش درخت‌های تصمیم را کاهش دهد. GBDT، XGBoost (چن و گسترین، 2016)، و CatBoost (Prokhorenkova و همکاران، 2018) مدل‌های مجموعه تقویت‌شده‌ای هستند که به‌طور متوالی درخت‌های تصمیم را برای تصحیح خطاهای درخت‌های قبلی می‌سازند که منجر به بهبود عملکرد در مجموعه داده‌های پیچیده با روابط غیر خطی می‌شود. .

اخیراً علاقه زیادی به مدل های یادگیری عمیق برای داده های جدولی شده است. برخی از روش ها متمایز پذیر را معرفی می کنند …

Source link