سلام علاقه مندان به AI!
به نسخه هفتم خوش آمدید “این هفته در مهندسی هوش مصنوعی”!
New GPT 4.5 در اینجا است ، Claude 3.7 Sonnet Anthropic کد شما را ابرقدرت می کند ، تحقیقات عمیق Perplexity برای تجزیه و تحلیل خودمختار رایگان است ، و ما حتی مدلهای مالی تخصصی نیز داریم!
با این کار ، ما همچنین در مورد برخی از ابزارهای لازم برای دانستن صحبت خواهیم کرد تا نمایندگان و برنامه های هوش مصنوعی را آسان تر کنیم.
GPT-4.5: LLM جدید Openai
Openai آزاد شده است GPT-4.5 به عنوان یک پیش نمایش تحقیق ، معرفی پیشرفت در یادگیری بدون نظارت که پیشرفت های قابل توجهی در دانش جهانی ، دقت واقعی و قابلیت های همکاری انسانی ارائه می دهد.
معماری فنی:
- چارچوب قبل از آموزش: مقیاس یادگیری بدون نظارت با معماری و نوآوری های بهینه سازی
- پردازش محاسبات: آموزش داده شده در زیرساخت های ابر رایانه مایکروسافت Azure AI
- الگوی مقیاس: به جای زنجیره های استدلال ، روی دقت و شهود مدل جهانی تمرکز می کند
- خط لوله نظارت: تکنیک های جدید ترکیبی از روش های سنتی SFT و RLHF
معیارهای عملکرد:
- دقت Simpleqa: 62.5 ٪ دقت واقعی (در مقابل 38.2 ٪ برای GPT-4O و 47 ٪ برای O1)
- میزان توهم: 37.1 ٪ در معیار SimpleQA (در مقابل 61.8 ٪ برای GPT-4O و 44 ٪ برای O1)
- ترجیح انسان: 63.2 ٪ نرخ برنده در نمایش داده شدگان حرفه ای در مقابل GPT-4O
- معیار MMLU: 85.1 ٪ دقت در …