آموزش ترجیحی درون متنی با استفاده از مدل های زبان بزرگ: جزئیات محیط

  1. چکیده و مقدمه
  2. کار مرتبط
  3. تعریف مشکل
  4. روش
  5. آزمایشات
  6. نتیجه گیری و مراجع

\
الف. ضمیمه

الف.1. درخواست های کامل و A.2 جزئیات ICPL

الف. 3 جزئیات پایه

الف.4 جزئیات محیطی

الف.5 اولویت انسانی پروکسی

A.6 ترجیح انسان در حلقه

الف.4 جزئیات محیط

در جدول 4، ابعاد مشاهده و عمل را به همراه شرح وظایف و معیارهای تکلیف برای 9 کار در IsaacGym ارائه می‌کنیم.

\
آموزش ترجیحی درون متنی با استفاده از مدل های زبان بزرگ: جزئیات محیط

\

:::اطلاعات
نویسندگان:

(1) چائو یو، دانشگاه Tsinghua;

(2) هنگ لو، دانشگاه Tsinghua;

(3) Jiaxuan Gao، دانشگاه Tsinghua;

(4) Qixin Tan، دانشگاه Tsinghua;

(5) Xinting Yang، دانشگاه Tsinghua;

(6) یو وانگ، با مشاوره یکسان از دانشگاه Tsinghua.

(7) یی وو، با مشاوره یکسان از دانشگاه Tsinghua و موسسه شانگهای Qi Zhi.

(8) یوجین وینیتسکی، با مشاوره مشابه از دانشگاه نیویورک ([email protected]).

:::


:::info این مقاله در arxiv تحت مجوز CC 4.0 موجود است.

:::

\

Source link