آخرین نسخه کلود حماسه برای برنامه نویسان است

سلام علاقه مندان به AI!

به نسخه هفتم خوش آمدید “این هفته در مهندسی هوش مصنوعی”!

New GPT 4.5 در اینجا است ، Claude 3.7 Sonnet Anthropic کد شما را ابرقدرت می کند ، تحقیقات عمیق Perplexity برای تجزیه و تحلیل خودمختار رایگان است ، و ما حتی مدلهای مالی تخصصی نیز داریم!

با این کار ، ما همچنین در مورد برخی از ابزارهای لازم برای دانستن صحبت خواهیم کرد تا نمایندگان و برنامه های هوش مصنوعی را آسان تر کنیم.


GPT-4.5: LLM جدید Openai

Openai آزاد شده است GPT-4.5 به عنوان یک پیش نمایش تحقیق ، معرفی پیشرفت در یادگیری بدون نظارت که پیشرفت های قابل توجهی در دانش جهانی ، دقت واقعی و قابلیت های همکاری انسانی ارائه می دهد.

معماری فنی:

  • چارچوب قبل از آموزش: مقیاس یادگیری بدون نظارت با معماری و نوآوری های بهینه سازی
  • پردازش محاسبات: آموزش داده شده در زیرساخت های ابر رایانه مایکروسافت Azure AI
  • الگوی مقیاس: به جای زنجیره های استدلال ، روی دقت و شهود مدل جهانی تمرکز می کند
  • خط لوله نظارت: تکنیک های جدید ترکیبی از روش های سنتی SFT و RLHF

معیارهای عملکرد:

  • دقت Simpleqa: 62.5 ٪ دقت واقعی (در مقابل 38.2 ٪ برای GPT-4O و 47 ٪ برای O1)
  • میزان توهم: 37.1 ٪ در معیار SimpleQA (در مقابل 61.8 ٪ برای GPT-4O و 44 ٪ برای O1)
  • ترجیح انسان: 63.2 ٪ نرخ برنده در نمایش داده شدگان حرفه ای در مقابل GPT-4O
  • معیار MMLU: 85.1 ٪ دقت در …

Source link