آیا ماشین ها واقعاً می توانند احساسات شما را درک کنند؟ ارزیابی مدل های زبان بزرگ برای همدلی

آیا واقعاً به همدلی فکر کرده اید؟ همدلی برای شما چه معنایی دارد؟ آیا توانایی شما در قضاوت درباره همدلی با توانایی شما در همدلی متفاوت است؟ این مقاله شما را به چالش می کشد تا این سؤالات را در نظر بگیرید زیرا من توانایی های مکالمه همدلانه 2 LLM اصلی و قابلیت های همدلی و شناسایی هوش مصنوعی 5 LLM را مقایسه می کنم.

هر LLM تحت سه سطح پیکربندی آزمایش شد:

  1. خام بدون اعلان سیستم
  2. یک پیام سیستمی که به سادگی این است: “شما مکالمات همدلانه دارید”
  3. با دستورات و آموزش اختصاصی

این منجر به شش دیالوگ شد که هر کدام پس از نتایج خلاصه ارائه شده است.

سناریوی آزمایشی دیالوگی با فردی ناشناس بود که شغل خود را از دست داده و در نتیجه غمگین و ترسیده است که نتواند اجاره خانه را بپردازد و تنها است زیرا دلش برای همکارانش تنگ شده است.

هر 6 دیالوگ به 5 LLM مختلف همراه با اعلان زیر ارائه شد، “مقایسه و مقایسه توانایی همدلانه فردی که در این مکالمات پشتیبانی می کند، و خروجی را به ترتیب رتبه بندی از بیشترین به کمترین با جزئیات انجام دهید. همچنین، بیشترین ترتیب مکالمات را بدهید. حداقل این احتمال وجود دارد که فردی که پشتیبانی را ارائه می دهد یک هوش مصنوعی است و چرا.

خلاصه نتایج

همانطور که جداول زیر نشان می دهد، نتایج در سراسر نقشه است. تقریباً هیچ یکنواختی در …

Source link