نویسندگان:
(1) Shehan Munasinghe، محمد بن زاید دانشگاه هوش مصنوعی و مشارکت برابر؛
(2) روسیرو توهارا، محمد بن زاید دانشگاه هوش مصنوعی و مشارکت برابر؛
(3) محمد معز، محمد بن زاید دانشگاه هوش مصنوعی;
(4) هانونا عبدالرشید، دانشگاه محمد بن زاید هوش مصنوعی؛
(5) سلمان خان، دانشگاه محمد بن زاید هوش مصنوعی و دانشگاه ملی استرالیا؛
(6) مبارک شاه، دانشگاه فلوریدا مرکزی;
(7) فهد خان، محمد بن زاید دانشگاه هوش مصنوعی و دانشگاه لینشوپینگ.
یادداشت ویرایشگر: این قسمت 2 از 10 مطالعه ای است که به جزئیات توسعه یک مدل هوش مصنوعی هوشمند برای ویدیوها می پردازد. بقیه را در ادامه بخوانید.
جدول پیوندها
مواد تکمیلی
پیشرفتهای اخیر در مدلهای چندوجهی بزرگ (LMM) [8, 18, 50] و مدل های زبان بزرگ (LLM) [7, 26, 36] چشم انداز هوش مصنوعی را به طور قابل توجهی تغییر داده اند، به ویژه در پردازش زبان طبیعی و وظایف چندوجهی. این پیشرفتها توانایی مدلهای یادگیری ماشین را برای درک و تولید متنهای انسانمانند افزایش داده است، در حالی که امکان ادغام مؤثر انواع دادههای مختلف مانند تصاویر، صداها و ویدیوها را با اطلاعات متنی فراهم میکند. این پیشرفت نشاندهنده یک جهش بزرگ در ایجاد سیستمهای هوش مصنوعی است که میتوانند به طور دقیق تفسیر کنند و با طیف متنوعی از…