تشخیص خشونت در ویدیوها: کارهای مرتبط

نویسندگان:

(1) Praveen Tirupattur، دانشگاه فلوریدا مرکزی.

تشخیص خشونت یکی از وظایف فرعی تشخیص فعالیت است که در آن فعالیت‌های خشونت‌آمیز باید از یک ویدیو شناسایی شوند. همچنین می توان آن را نوعی تشخیص رویداد چند رسانه ای در نظر گرفت. برخی از رویکردها قبلا برای رفع این مشکل پیشنهاد شده است. این رویکردهای پیشنهادی را می‌توان به سه دسته طبقه‌بندی کرد: (1) رویکردهایی که در آنها فقط ویژگی‌های بصری استفاده می‌شود. (ii) رویکردهایی که در آنها فقط از ویژگی های صوتی استفاده می شود. (iii) رویکردهایی که در آن از هر دو ویژگی صوتی و تصویری استفاده می شود. مقوله مورد علاقه در اینجا دسته سوم است که در آن از هر دو تصویر و صدا استفاده می شود. این فصل مروری بر برخی از رویکردهای قبلی مربوط به هر یک از این دسته ها ارائه می دهد.

2.1. استفاده از صدا و تصویر

تلاش اولیه برای تشخیص خشونت با استفاده از نشانه های صوتی و تصویری توسط Nam و همکاران انجام شده است. [41]. در کار آنها، هم از ویژگی‌های صوتی و هم بصری برای شناسایی صحنه‌های خشونت‌آمیز و ایجاد نمایه‌ها استفاده می‌شود تا امکان جستجوی محتوایی ویدیوها فراهم شود. در اینجا، امضای فعالیت پویای مکانی-زمانی برای هر عکس استخراج می‌شود تا آن را به خشونت یا غیرخشونت دسته‌بندی کند. این ویژگی فعالیت دینامیکی مکانی-زمانی بر اساس میزان حرکت دینامیکی است که …

Source link