یادگیری مشارکتی با مدل های بزرگ زبان

مدل های زبان بزرگ (LLM) به طور قابل توجهی وضعیت هنر را برای حل وظایف مشخص شده با استفاده از زبان طبیعی بهبود بخشیده اند و اغلب به عملکردی نزدیک به عملکرد افراد می رسند. از آنجایی که این مدل‌ها به طور فزاینده‌ای عوامل کمکی را قادر می‌سازند، یادگیری مؤثر از یکدیگر می‌تواند برای آنها مفید باشد، درست مانند افرادی که در محیط‌های اجتماعی انجام می‌دهند، که به عوامل مبتنی بر LLM اجازه می‌دهد عملکرد یکدیگر را بهبود بخشند.

برای بحث در مورد فرآیندهای یادگیری انسان، بندورا و والترز مفهوم را شرح دادند یادگیری اجتماعی در سال 1977، مدل های مختلف یادگیری مشاهده ای مورد استفاده توسط مردم را تشریح کرد. یکی از روش های رایج یادگیری از دیگران از طریق الف است آموزش شفاهی (به عنوان مثال، از یک معلم) که نحوه درگیر شدن در یک رفتار خاص را توضیح می دهد. روش دیگر، یادگیری می تواند از طریق a مدل زنده با تقلید یک مثال زنده از رفتار.

با توجه به موفقیت LLM هایی که ارتباطات انسانی را تقلید می کنند، در مقاله ما “یادگیری اجتماعی: به سوی یادگیری مشارکتی با مدل های زبان بزرگ”، بررسی می کنیم که آیا LLM ها می توانند با استفاده از یادگیری اجتماعی از یکدیگر یاد بگیرند یا خیر. برای این منظور، ما چارچوبی را برای یادگیری اجتماعی ترسیم می‌کنیم که در آن LLMها دانش را به شیوه‌ای آگاه از حریم خصوصی با استفاده از زبان طبیعی با یکدیگر به اشتراک می‌گذارند. ما اثربخشی چارچوب خود را بر روی مجموعه داده‌های مختلف ارزیابی می‌کنیم و روش‌های کمی را پیشنهاد می‌کنیم که حریم خصوصی را در این تنظیمات اندازه‌گیری می‌کنند. برخلاف رویکردهای قبلی برای یادگیری مشارکتی، مانند رویکردهای رایج یادگیری فدرال که اغلب بر شیب ها متکی هستند، در چارچوب ما، عوامل صرفاً با استفاده از زبان طبیعی به یکدیگر آموزش می دهند.