این هوش مصنوعی می تواند گفتار، موسیقی و جلوه های صوتی را از موسیقی متن فیلم جدا کند

میتسوبیشی و دانشگاه ایندیانا یک مدل جدید و همچنین مجموعه داده جدیدی منتشر کرده اند که وظیفه شناسایی موسیقی متن مناسب را بر عهده دارد. مشکل در اینجا جدا کردن هر منبع صوتی مستقل از یک صحنه آکوستیک پیچیده مانند یک صحنه فیلم یا یک ویدیوی یوتیوب است که در آن برخی صداها به خوبی متعادل نیستند. اگر با موفقیت دسته‌های مختلف را در یک موسیقی متن جدا کنید، به این معنی است که می‌توانید فقط یکی از آن‌ها را کم یا زیاد کنید، مثلاً برای شنیدن صحیح همه بازیگران، موسیقی را کمی کم کنید.

تصویر
عکس پروفایل ظهر لویی بوچارد هکر

لوئیس بوچارد

من اصطلاحات و اخبار هوش مصنوعی را برای افراد غیر متخصص توضیح می دهم.

آیا تا به حال در یک ویدیو یا یک برنامه تلویزیونی کوک کرده اید که بازیگران کاملاً نامفهوم باشند یا موسیقی خیلی بلند باشد؟ خب، این مشکل که مشکل کوکتل پارتی نیز نامیده می شود، ممکن است دیگر هرگز تکرار نشود. میتسوبیشی و دانشگاه ایندیانا به تازگی یک مدل جدید و همچنین مجموعه داده جدیدی منتشر کرده اند که وظیفه شناسایی موسیقی متن مناسب را بر عهده دارد. به عنوان مثال، اگر همان کلیپ صوتی را که فقط با صدای خیلی بلند اجرا کردیم، بگیریم، می‌توانید به سادگی آهنگ صوتی را که می‌خواهید به سخنرانی اهمیت بیشتری بدهید تا موسیقی، کم یا زیاد کنید.

مشکل در اینجا جدا کردن هر منبع صوتی مستقل از یک صحنه آکوستیک پیچیده مانند یک صحنه فیلم یا یک ویدیوی یوتیوب است که در آن برخی صداها خوب نیستند…