چکیده و 1 مقدمه و انگیزه
2 معماری و 2.1 مجموعه داده
2.2 استخراج کننده
2.3 دونده
3 خط لوله استخراج
4 Ducho به عنوان برنامه Docker
5 تظاهرات و 5.1 نسخه ی نمایشی 1: ویژگی های بصری + متنی
5.2 نسخه ی نمایشی 2: ویژگی های صوتی + ویژگی های متنی
5.3 نسخه ی نمایشی 3: موارد متنی/ویژگی های تعامل 6
نتیجه گیری و کار آینده ، تصدیق و منابع
5 تظاهرات
بخش وی سه مورد استفاده (یعنی نسخه ی نمایشی) را پیشنهاد می کند که برخی از ویژگی های اصلی در Ducho و نحوه بهره برداری از آنها را در یک خط لوله استخراج چند حالته کامل نشان می دهد. دستورالعمل ها و کدها در این لینک قابل دسترسی هستند[4] برای اجرای نسخه های نمایشی (i) در دستگاه محلی خود ، (ii) در یک ظرف docker و (iii) در Google Colab. توجه داشته باشید که ما به طور خاص این نسخه های نمایشی را انتخاب کردیم تا برخی از وظایف توصیه های واقعی را شامل شود که شامل ویژگی های چند حالته است.
5.1 نسخه ی نمایشی 1: ویژگی های ویژوال + موارد متنی
توصیه مد احتمالاً یکی از محبوب ترین کار با ویژگی های چند حالته برای توصیف موارد است. به طور کلی ، محصولات مد مجهز به تصاویر (یعنی بصری) و توضیحات (یعنی متنی) هستند که ممکن است توجه مشتری را به خود جلب کند.
داده های ورودی ما از یک مجموعه داده مد کوچک استفاده می کنیم که در آن هر مورد دارای تصویر خاص و ابرداده های دیگر مانند جنسیت ، دسته ، رنگ ، فصل و محصول است …