وضعیت فعلی GPT4All

چکیده و 1. مقدمه

2 مدل اصلی GPT4All

2.1 گردآوری و مدیریت داده ها

2.2 آموزش مدل، 2.3 دسترسی به مدل و 2.4 ارزیابی مدل

3 از یک مدل به یک اکوسیستم

3.1 GPT4All-J: رشد مخزن و پیامدهای مجوز LLaMA

3.2 GPT4All-Snoozy: ظهور اکوسیستم GPT4All

3.3 وضعیت فعلی GPT4All

4 آینده GPT4All

محدودیت ها و مراجع

3.3 وضعیت فعلی GPT4All

امروزه، GPT4All بر بهبود دسترسی به مدل‌های زبان منبع باز متمرکز است. این مخزن نسخه‌های فشرده‌شده مدل‌های منبع باز را برای استفاده در سخت‌افزار کالا، APIهای مدل سطح بالا پایدار و ساده و یک رابط کاربری گرافیکی برای آزمایش مدل بدون کد ارائه می‌کند. محبوبیت این پروژه همچنان در حال افزایش است و از 1 آگوست 2023، بیش از 50000 ستاره GitHub و بیش از 5000 فورک به دست آورده است.

شکل 1: تجسم های TSNE که پیشرفت مجموعه قطار GPT4All را نشان می دهد. پانل (a) داده های اصلی را نشان می دهد. فلش قرمز ناحیه‌ای از جفت‌های پاسخ سریع بسیار همگن را نشان می‌دهد. رنگ‌آمیزی نشان می‌دهد که کدام مجموعه داده باز در این درخواست کمک کرده است. پانل (ب) داده های اصلی GPT4All را پس از تنظیم نشان می دهد. این پانل و همچنین پانل های (c) و (d) 10 رنگی بر اساس موضوع هستند که اطلس به طور خودکار استخراج می کند. توجه داشته باشید که حباب‌های بزرگ همگن واکنش سریع دیگر ظاهر نمی‌شوند. پانل (c) مجموعه داده GPT4All-J را نشان می دهد. را شکل 1: تجسم های TSNE که پیشرفت مجموعه قطار GPT4All را نشان می دهد. پانل (a) داده های اصلی را نشان می دهد. فلش قرمز ناحیه‌ای از جفت‌های پاسخ سریع بسیار همگن را نشان می‌دهد. رنگ‌آمیزی نشان می‌دهد که کدام مجموعه داده باز در این درخواست کمک کرده است. پانل (ب) داده های اصلی GPT4All را پس از تنظیم نشان می دهد. این پانل و همچنین پانل های (c) و (d) 10 رنگی بر اساس موضوع هستند که اطلس به طور خودکار استخراج می کند. توجه داشته باشید که حباب‌های بزرگ همگن واکنش سریع دیگر ظاهر نمی‌شوند. پانل (c) مجموعه داده GPT4All-J را نشان می دهد. را

جدول 1: ارزیابی همه مدل‌های زبان در اکوسیستم GPT4All از 1 اوت 2023. مدل‌های کد گنجانده نشده است. متن-davinci-003 OpenAI به عنوان یک نقطه مقایسه گنجانده شده است. بهترین مدل عملکرد کلی در اکوسیستم GPT4All، Nous-Hermes2، بیش از 92 درصد از میانگین عملکرد text-davinci-003 را به دست می آورد. از زمان عرضه GPT4All-Snoozy، مدل‌های علامت‌گذاری شده با ستاره در اکوسیستم موجود بودند. توجه داشته باشید که در زمان عرضه، GPT4All-Snoozy بهترین عملکرد متوسط ​​را در بین هر مدلی در اکوسیستم داشت. اعداد پررنگ نشان دهنده بهترین مدل از 1 آگوست 2023 است.جدول 1: ارزیابی همه مدل‌های زبان در اکوسیستم GPT4All از 1 اوت 2023. مدل‌های کد گنجانده نشده است. متن-davinci-003 OpenAI به عنوان یک نقطه مقایسه گنجانده شده است. بهترین مدل عملکرد کلی در اکوسیستم GPT4All، Nous-Hermes2، بیش از 92 درصد از میانگین عملکرد text-davinci-003 را به دست می آورد. از زمان عرضه GPT4All-Snoozy، مدل‌های علامت‌گذاری شده با ستاره در اکوسیستم موجود بودند. توجه داشته باشید که در زمان عرضه، GPT4All-Snoozy بهترین عملکرد متوسط ​​را در بین هر مدلی در اکوسیستم داشت. اعداد پررنگ نشان دهنده بهترین مدل از 1 آگوست 2023 است.

شکل 2: مقایسه رشد شروع github GPT4All، LLaMA متا، و Alpaca استانفورد. ما حدس می زنیم که GPT4All به دلیل تمرکز بر دسترسی، رشد سریع اکوسیستم را به دست آورده و حفظ می کند، که به کاربران بیشتری اجازه می دهد به طور معناداری مشارکت کنند.شکل 2: مقایسه رشد شروع github GPT4All، LLaMA متا، و Alpaca استانفورد. ما حدس می زنیم که GPT4All به دلیل تمرکز بر دسترسی، رشد سریع اکوسیستم را به دست آورده و حفظ می کند، که به کاربران بیشتری اجازه می دهد به طور معناداری مشارکت کنند.

GPT4All در حال حاضر پشتیبانی بومی و داده های معیار را برای بیش از 35 مدل ارائه می دهد (شکل 1 را ببینید)، و شامل چندین مدل است که با شرکای صنعتی مانند Replit و Hugging Face توسعه یافته اند. GPT4All همچنین API های مدل سطح بالایی را در زبان هایی از جمله Python، Typescript، Go، C# و Java و غیره ارائه می دهد. علاوه بر این، رابط کاربری گرافیکی GPT4All بدون کد در حال حاضر از گردش کار بیش از 50000 کاربر فعال ماهانه، با بیش از 25 درصد از کاربران، پشتیبانی می کند.

Source link