نویسندگان:
(1) Shehan Munasinghe، محمد بن زاید دانشگاه هوش مصنوعی و مشارکت برابر؛
(2) روسیرو توهارا، محمد بن زاید دانشگاه هوش مصنوعی و مشارکت برابر؛
(3) محمد معز، محمد بن زاید دانشگاه هوش مصنوعی;
(4) هانونا عبدالرشید، دانشگاه محمد بن زاید هوش مصنوعی؛
(5) سلمان خان، دانشگاه محمد بن زاید هوش مصنوعی و دانشگاه ملی استرالیا؛
(6) مبارک شاه، دانشگاه فلوریدا مرکزی;
(7) فهد خان، محمد بن زاید دانشگاه هوش مصنوعی و دانشگاه لینشوپینگ.
یادداشت ویرایشگر: این قسمت 7 از 10 مطالعه ای است که به جزئیات توسعه یک مدل هوش مصنوعی هوشمند برای ویدیوها می پردازد. بقیه را در ادامه بخوانید.
جدول پیوندها
مواد تکمیلی
4.3. زمینه سازی فضایی در فیلم ها
برای ارزیابی کمی قابلیت زمینسازی فضایی PG-Video-LLaVA، ارزیابیهای کمی از قابلیتهای زمینبندی فضایی PGVideo-LLaVA را با استفاده از دو معیار که از مجموعه آزمایشی VidSTG مشتق شدهاند، انجام دادیم. [48] و HC-STVG [34] مجموعه داده ها با توجه به تازگی
با ادغام زمینسازی فضایی در مدلهای مکالمه ویدیویی، ماهیت مدولار خط لوله اتصال زمین خود را برجسته میکنیم، که میتواند با دیگر مدلهای مکالمه ویدیویی پیشرفته ترکیب شود. برای مجموعه داده VidSTG،
ما بهطور انتخابی درخواستهای بازجویی را برای ارزیابی زمینهسازی پردازش کردیم…