نویسندگان:
(1) Vijay Ekambaram ، تحقیقات IBM ؛
(2) Arindam Jati ، IBM Research ؛
(3) Nam H. Nguyen ، تحقیقات IBM ؛
(4) Pankaj Dayama ، IBM Research ؛
(5) چاندرا ردی ، تحقیقات IBM ؛
(6) وسلی م. گیفورد ، تحقیقات IBM ؛
(7) جیانت کالاگنانام ، تحقیقات IBM.
یادداشت ویرایشگر: این قسمت 2 از 5 مطالعه است که جزئیات توسعه یک مدل کوچک و سریع هوش مصنوعی را ارائه می دهد که دقت بسیار خوبی را ارائه می دهد. بقیه را در زیر بخوانید.
جدول پیوندها
2 مؤلفه TTM
2.1 مدل سازی چند سطحی
TTM از یک معماری چند سطحی متشکل از چهار مؤلفه کلیدی پیروی می کند (شکل 1 (الف)) را ببینید: (1) ستون فقرات TTM با استفاده از بلوک های ساختمانی حاصل از معماری کارآمد Tsmixer مونتاژ می شود [Ekambaram et al., 2023]بشر Tsmixer مبتنی بر بلوک های ساده MLP است که امکان اختلاط ویژگی ها را در تکه ها ، در میان تکه ها و کانال ها فراهم می کند و از رویکردهای TS مبتنی بر ترانسفورماتور موجود با حداقل نیازهای محاسباتی فراتر می رود. از آنجا که Tsmixer برای کنترل داده های چند وضوح هدف قرار نگرفته است ، ما پیشرفتهای جدید جدیدی را با آن معرفی می کنیم که بعداً توضیح داده شد. (2) رمزگذار TTM همان معماری ستون فقرات را دنبال می کند اما از نظر اندازه بسیار کوچکتر است ، تقریباً 10-20 ٪ از اندازه ستون فقرات ، (3) پیش بینی شامل یک سر خطی است که برای تولید خروجی پیش بینی شده و (4) اختیاری طراحی شده است مخلوط کننده اگزوژن خدمت به فیوز …