تاثیر طول گفتار و تنوع واج بر موفقیت حمله PT-AE

چکیده و مقدمه

پیشینه و انگیزه

آموزش طوطی: امکان سنجی و ارزیابی

نسل PT-AE: دیدگاه قابل انتقال و ادراک مشترک

بهینه سازی حملات PT-AE جعبه سیاه

ارزیابی های تجربی

کار مرتبط

نتیجه گیری و مراجع

ضمیمه

VI. ارزیابی های تجربی

در این بخش، ما تأثیرات حمله PT-AE خود را در تنظیمات دنیای واقعی اندازه گیری می کنیم. ما ابتدا تنظیمات خود را شرح می دهیم و سپس نتایج تجربی را ارائه و بحث می کنیم.

الف. تنظیمات آزمایشی

تنظیمات حمله PT-AE: ما 3 مدل CNN و 3 مدل TDNN را برای ساختن مدل N = 6 PT با پارامترهای مختلف برای ترکیب در (5) انتخاب می کنیم. هر مدل PT دارای دانش یک جمله ای (گفتار 8 ثانیه ای) از گوینده هدف است که از LibriSpeech انتخاب شده است. [87] یا VoxCeleb1 [83] مجموعه داده ها ما به طور تصادفی 6-16 بلندگو از مجموعه داده VCTK را به عنوان بلندگوهای دیگر برای ساخت هر مدل PT انتخاب می کنیم. از بین 200 حامل صدای محیطی، K = 50 حامل را انتخاب می کنیم [47] برای تشکیل مجموعه نامزد برای مهاجم و می تواند زیر و بمی صدا را تا 25 نیم صدا به بالا/پایین تغییر دهد. آستانه انرژی کل ϵ روی 0.08 تنظیم شده است.

سیستم های تشخیص بلندگوی هدف: هدف ما ارزیابی حملات علیه دو نوع عمده از سیستم‌های تشخیص بلندگو است: الف) ارزیابی‌های خط دیجیتال: ما مستقیماً…

Source link