من مجموعه ای از مقاله ها را در مورد هوش مصنوعی نوشتم و همدلی و معیارهای سه ماهه بعدی در LLM های اصلی به زودی ارائه می شوند. با این حال ، با انتشار اخیر CHATGPT 4.5 و ادعاهای Openai در مورد EQ بالاتر همراه با هزینه فوق العاده بالا در پیش نمایش (75.00 دلار در هر میلیون ورودی توکن و 150.00 دلار در هر میلیون دلار در مقابل 2.50 دلار و 10.00 دلار برای V4O) فکر می کردم مناسب است V4.5 را با سایر نسخه های Chargpt با استفاده از یک آزمون واقعی ECPTAMET استفاده کند. Topline ، اگرچه رفتار کلی چتپپ 4.5 ممکن است دوستانه تر و مفیدتر باشد ، پیشرفت در EQ Actuall و توانایی ظاهر شدن از نظر عاطفی و هوشمندانه در موقعیت هایی که به آن نیاز دارد ، ارزش 15 برابر به علاوه افزایش قیمت بیش از 4O را ندارد که هم از یک آزمون استاندارد و هم از دیدگاه گفتگو نمره می دهد. در حقیقت ، در بسیاری از موارد chatgpt 4.5 خود حتی پاسخ های 4 ، 4O و Claude Sonnet 3.7 را بهتر از خودش ارزیابی می کند.
توجه داشته باشید ، بخش های اساسی این مقاله تولید شده است ، اما نکته مقاله این است که:
-
پاسخ های LLM را مقایسه کنید
-
chatgpt 4.5 در مورد رفتار کاشته شده و سایر LLM ها تأمل کنید
تست های استاندارد شده
آزمون استاندارد EQ و نمره AEM در معیارهای Q3 من بیشتر مورد بحث قرار می گیرد. برای این مقاله خاص EQ …