چگونه یک گله از مدل ها تسلط ChatGPT را به چالش می کشد: چکیده و مقدمه

نویسندگان:

(1) سوریا نارایانان هاری، گروه زیست شناسی و مهندسی بیولوژیک موسسه فناوری کالیفرنیا (ایمیل: [email protected])

(2) مت تامسون، گروه زیست شناسی و برنامه مهندسی بیولوژیکی در سیستم های محاسباتی و عصبی موسسه فناوری کالیفرنیا (ایمیل: [email protected]).

چکیده و مقدمه

نتیجه گیری و بحث و مراجع

خلاصه

در حال حاضر، بیش از هزار LLM وجود دارد که چند منظوره هستند و قادر به انجام وظایف دنیای واقعی، از جمله پرسش و پاسخ، خلاصه سازی متن، تولید محتوا و غیره هستند. با این حال، دسترسی، مقیاس و قابلیت اطمینان مدل‌های رایگان مانع از به کارگیری گسترده آنها در روزمره می‌شود. موارد استفاده برای رسیدگی به دو موضوع اول دسترسی و مقیاس، سازمان‌هایی مانند HuggingFace مخازن مدل ایجاد کرده‌اند که در آن کاربران وزن‌های مدل و نسخه‌های کوانتیزه‌شده‌ای از مدل‌های آموزش دیده با استفاده از پارادایم‌های مختلف و همچنین کارت‌های مدلی را که فرآیند آموزش آنها را توصیف می‌کنند، آپلود کرده‌اند. در حالی که برخی از مدل‌ها عملکرد را بر روی معیارهای رایج گزارش می‌دهند، همه این کار را نمی‌کنند، و تفسیر تأثیر دنیای واقعی معامله کردن عملکرد بر روی یک معیار برای هزینه استقرار مدل، نامشخص است. در اینجا، ما نشان می‌دهیم که دسته‌ای از مدل‌های منبع باز می‌توانند با عملکرد اختصاصی مطابقت داشته باشند یا از آن فراتر بروند…

Source link