روشی جدید برای تجزیه و تحلیل سوگیری نژادی: پیوست: اندازه گیری سمیت

:::info این مقاله در arxiv تحت مجوز CC 4.0 موجود است.

نویسندگان:

(1) محمد یوسف کوچیگیت، دانشگاه بوستون؛

(2) آنیتی اندی، دانشگاه پنسیلوانیا.

(3) دری ویجایا، دانشگاه بوستون.

:::

  • چکیده و مقدمه
  • کارهای مرتبط
  • داده ها
  • روش
  • تجزیه و تحلیل و نتایج
  • نتیجه
  • محدودیت ها
  • بیانیه اخلاق و مراجع
  • ضمیمه: اندازه گیری سمیت
  • پیوست: همبستگی در طول زمان
  • ضمیمه: ویکی داده
  • ضمیمه: حساسیت فراپارامتر

ضمیمه: اندازه گیری سمیت

برای اندازه‌گیری سمیت، از یک روش فیلتر برای حذف کلماتی استفاده می‌کنیم که ممکن است در طول زمان معنای سمی خود را از دست بدهند. ما از زیرمجموعه محافظه کارانه Hurtlex (Bassignana، Basile و Patti 2018) استفاده می کنیم و همه دسته بندی های غیر سمی را در تجزیه و تحلیل خود لحاظ می کنیم. در جدول 2 کلماتی را می بینیم که از لیست کلمات سمی حذف شده اند. چند مشاهدات جالب در مورد کلمات مربوط به فحشا به طور کلی در دهه های اولیه حذف شده است. این ممکن است به این دلیل باشد که اگرچه آنها هنوز می‌توانستند تابو داشته باشند، اما در آن زمان که فیلتر شده بودند، تفاوت کافی در نحوه ارتباط آنها با کلمات دیگر داشتند. مشاهدات جالب دیگر این است که کلمه فاشیست در طول دهه های 1930 و 1940 فیلتر شد. این قبل از جنگ جهانی دوم است که بسیاری از احساسات ملی گرایانه در حال تبدیل شدن به جریان اصلی بودند …

سئو PBN | خبر های جدید سئو و هک و سرور