حملات مخالف ، تمامیت مدلهای زبان گفتار را به چالش می کشد

قسمت 1: چکیده و مقدمه

قسمت 2: زمینه

قسمت 3: حملات و اقدامات متقابل

قسمت 4: تنظیم آزمایشی

قسمت 5: مجموعه داده ها و ارزیابی

قسمت 6: حمله ، پارامترهای ضد اندازه گیری ، و پایه: آشفتگی های تصادفی

قسمت 7: نتایج و بحث

قسمت 8: انتقال حملات و اقدامات متقابل

قسمت 9: نتیجه گیری ، محدودیت ها و بیانیه اخلاق

قسمت 10: پیوست: رمزگذار صوتی قبل از آموزش و ارزیابی

قسمت 11: پیوست: حملات متقابل ، آموزش فرسایش داده ها و تأثیر سر و صدای تصادفی بر کمک

قسمت 12: پیوست: حملات تطبیقی ​​و نمونه های کیفی

3. حملات و اقدامات متقابل

در میان برنامه های مختلف برای SLM ها ، در این کار ، حملات مخالف و تکنیک های دفاعی را برای انجام وظیفه QA به نمایش می گذاریم. ما ادبیات تثبیت شده را در حملات و دفاع های مخالف دنبال می کنیم و آن تکنیک ها را به منظور فرار از SLM ها سازگار می کنیم. به طور خاص ، ما دو سناریوی حمله متفاوت را کشف می کنیم: جعبه سفید و جعبه سیاه ، مشابه رویکرد در چی و همکاران. (2023) ، و در نتیجه شناسایی اقدامات متقابل.

3.1 روش حمله

حمله جعبه سفید این سناریو یک مهاجم را با دسترسی کامل به SLM از جمله توانایی بازگشت مجدد از طریق مدل فرض می کند (Goodfellow و همکاران ، 2014). به عنوان مثال ، می توان از …

Source link