پرده برداری از قدرت توجه به خود برای پیش بینی هزینه حمل و نقل: آزمایش

نویسندگان:

(1) P Aditya Sreekar، آمازون و این نویسندگان به طور مساوی به این کار کمک کردند {[email protected]};

(2) Sahil Verm، آمازون و این نویسندگان به طور مساوی در این کار کمک کردند {[email protected];}

(3) وارون ماداوان، موسسه فناوری هند، خاراگپور. کارهای انجام شده در حین کارآموزی در آمازون {[email protected]};

(4) آبیشک پرساد، آمازون {[email protected]}.

4. آزمایشات

در این بخش، عملکرد RCT بر روی مجموعه داده ای از بسته های ارسال شده در سال 2022 نشان داده شده است. میانگین خطای مطلق (MAE) بین هزینه حمل و نقل پیش بینی شده و واقعی به عنوان معیار عملکرد انتخاب می شود، زیرا نماینده خطای مطلق در شرایط پولی در این مقاله، مقادیر MAE با برآورد اکتشافی MAE روز صفر، که به صورت درصد MAE (MAE%) بیان می‌شود، نرمال می‌شوند. این معیار بر بهبود به دست آمده در برابر خط پایه اکتشافی تأکید می کند.

4.1. راه اندازی آزمایشی

4.1.1. معماری و هایپرامترها

ابعاد تعبیه شده روی 128 تنظیم شد و از 6 لایه رمزگذار ترانسفورماتور استفاده شد که هر کدام دارای 16 سر خود توجه بودند. بهینه ساز Adam (Kingma and Ba, 2014) با نرخ شروع یادگیری 0.0001 و اندازه دسته ای 2048 استفاده شد. برای بهبود همگرایی، نرخ یادگیری با ضریب 0.7 در هر بار اعتبارسنجی کاهش می یابد.

Source link