جدول پیوندها
-
چکیده و مقدمه
-
SylloBio-NLI
-
ارزیابی تجربی
-
کار مرتبط
-
نتیجه گیری
-
محدودیت ها و مراجع
\
الف. رسمی کردن فرآیند تولید منابع SylloBio-NLI
ب- رسمی سازی وظایف 1 و 2
ج. فرهنگ عضویت ژن و مسیر
D. خط لوله مخصوص دامنه برای ایجاد نمونه های NL و دسترسی E به LLM
F. جزئیات تجربی
ز. معیارهای ارزیابی
H. درخواست LLMs – دستورات صفر شات
I. درخواست LLM – چند اعلان
J. نتایج: دستورالعمل-پاسخ نامناسب
K. نتایج: تأثیر مبهم عوامل حواس پرتی بر استدلال
L. نتایج: مدلها دانش زمینهای را بر دانش زمینه اولویت میدهند
M شکل های تکمیلی و N جداول تکمیلی
K نتایج: تأثیر مبهم عوامل حواس پرتی بر استدلال
LLM ها حساسیت جزئی به افزایش تعداد nD حواس پرت کننده ها در اعلان نشان می دهند، با دقت کلی ثابت باقی می ماند (شکل های 12-15، جدول 4).
\ در حالی که برخی از مدلها با افزایش nD دست و پنجه نرم میکنند، برخی دیگر میتوانند از یادگیری چند شات برای کاهش تأثیر آنها استفاده کنند، اگرچه این اثر وابسته به طرح است. با در نظر گرفتن وظیفه 1، در تنظیمات ZS (شکل 12، جدول 6)، Gemma-7b کاهش قابل توجهی در دقت را با افزایش nD نشان می دهد، به ویژه در معضل تعمیم یافته (r = -0.643، p = 0.001)، مدوس پوننس تعمیم یافته ( r = -0.592، p…