SLMS از رقبای بهتر از این که دچار زندان سریع مخالف هستند

قسمت 1: چکیده و مقدمه

قسمت 2: زمینه

قسمت 3: حملات و اقدامات متقابل

قسمت 4: تنظیم آزمایشی

قسمت 5: مجموعه داده ها و ارزیابی

قسمت 6: حمله ، پارامترهای ضد اندازه گیری ، و پایه: آشفتگی های تصادفی

قسمت 7: نتایج و بحث

قسمت 8: انتقال حملات و اقدامات متقابل

قسمت 9: نتیجه گیری ، محدودیت ها و بیانیه اخلاق

قسمت 10: پیوست: رمزگذار صوتی قبل از آموزش و ارزیابی

قسمت 11: پیوست: حملات متقابل ، آموزش فرسایش داده ها و تأثیر سر و صدای تصادفی بر کمک

قسمت 12: پیوست: حملات تطبیقی ​​و نمونه های کیفی

5. نتایج و بحث

در این بخش ، ما ابتدا تراز ایمنی چندین SLM را تجزیه و تحلیل می کنیم و به دنبال آن نتایج حملات خاص و مبتنی بر انتقال ، و همچنین اثربخشی دفاع TDNF را نشان می دهیم.

5.1 SLMS با ایمنی

ما اثرات SLM های مختلف آموزش داده شده با استفاده از معماری گفتار را مقایسه می کنیم ، در برابر یک مدل SLM عمومی SHEAPHGPT (ژانگ و همکاران ، 2023) در جدول 2. جعبه ما همچنین FLAN-T5-XL (3B) و Mistral-7B LLMS را با هم تنظیم می کنیم ، ایمنی با فرم متنی داده های QA گفتاری تراز می شود.

نتایج ما نشان دهنده عملکرد برتر مدلهای SLM ما در مقایسه با مدل های عمومی ، از نزدیک …

Source link