جدول پیوندها
قسمت 1: چکیده و مقدمه
قسمت 2: زمینه
قسمت 3: حملات و اقدامات متقابل
قسمت 4: تنظیم آزمایشی
قسمت 5: مجموعه داده ها و ارزیابی
قسمت 6: حمله ، پارامترهای ضد اندازه گیری ، و پایه: آشفتگی های تصادفی
قسمت 7: نتایج و بحث
قسمت 8: انتقال حملات و اقدامات متقابل
قسمت 9: نتیجه گیری ، محدودیت ها و بیانیه اخلاق
قسمت 10: پیوست: رمزگذار صوتی قبل از آموزش و ارزیابی
قسمت 11: پیوست: حملات متقابل ، آموزش فرسایش داده ها و تأثیر سر و صدای تصادفی بر کمک
قسمت 12: پیوست: حملات تطبیقی و نمونه های کیفی
4.3 مجموعه داده
داده های آموزش ما از 2.5 کیلوگرم ساعت موازی گفتار در خانه ASR برای مرحله قبل از تغییر استفاده می کنیم ، که شامل ترکیبی از لهجه ها ، بلندگوها ، نرخ نمونه برداری و صداهای پس زمینه است. ما فقط به دلیل محدودیت های محاسبه ، از داده های آموزش ASR 2.5 کیلوگرم استفاده می کنیم ، اما داده های ASR در دسترس عموم که در مقادیر بیشتر در دسترس هستند می توانند جایگزینی قطره ای باشند. از آنجا که هیچ داده ای در دسترس عموم برای کار QA گفتاری با آموزش گفتار و جفت های پاسخ متنی ، مشابه ژانگ و همکاران وجود ندارد. (2023) ، ما یک داده آموزشی از جفت های متن گفتار 160K به مبلغ 150 ساعت محتوای صوتی با استفاده از مجموعه داده های تنظیم آموزش متن-متن در دسترس و یک خانه ایجاد می کنیم …