Multi-EuP: تجزیه و تحلیل سوگیری در بازیابی اطلاعات – استفاده از Multi-EuP

:::info این مقاله در arxiv تحت مجوز CC 4.0 موجود است.

نویسندگان:

(1) Jinrui Yang، دانشکده محاسبات و سیستم های اطلاعاتی، دانشگاه ملبورن (ایمیل: [email protected]

(2) تیموتی بالدوین، دانشکده محاسبات و سیستم های اطلاعاتی، دانشگاه ملبورن و دانشگاه هوش مصنوعی محمد بن زاید، امارات متحده عربی (ایمیل: (tbaldwin,trevor.cohn)@unimelb.edu.au);

(3) ترور کوهن، دانشکده محاسبات و سیستم های اطلاعاتی، دانشگاه ملبورن.

:::

چکیده و مقدمه

پیشینه و کارهای مرتبط

Multi-EuP

آزمایش ها و یافته ها

بحث تعصب زبان

نتیجه‌گیری، محدودیت‌ها، بیانیه‌های اخلاقی، قدردانی‌ها، مراجع و پیوست

3 Multi-EuP

در رویکرد خود، ما موضوعات بحث را پرسش‌ها می‌دانیم و متن هر سخنرانی را که توسط یک نماینده پارلمان اروپا ارائه می‌شود، سند می‌دانیم.

\
موضوعات موضوعات به طور رسمی توسط اتحادیه اروپا حاشیه نویسی شده و به صورت حرفه ای به 24 زبان مختلف ترجمه شده است.[5] در طول پیش پردازش، موضوعات بحث رویه ای مانند دستور جلسه، 1.1 هزار موضوع منحصر به فرد باقی می گذارد. آنها به عنوان یک منبع ارزشمند برای ارزیابی تعصب زبانی در روش‌های رتبه‌بندی چند زبانه عمل خواهند کرد، با توجه به اینکه همه موضوعات در زبان‌های مختلف از نظر معنایی سازگار هستند.

\
اسناد 22 هزار …