برگه های داده برای مجموعه داده ها: تأثیر و پذیرش در بخش های دانشگاهی و صنعتی

نویسندگان:

(1) TIMNIT GEBRU، سیاه در هوش مصنوعی.

(2) جیمی مورگنسترن، دانشگاه واشنگتن.

(3) BRIANA VECCHIONE، دانشگاه کرنل.

(4) JENNIFER WORTMAN VAUGHAN، Microsoft Research;

(5) HANNA WALLACH، Microsoft Research;

(6) HAL DAUMÉ III، Microsoft Research; دانشگاه مریلند؛

(7) کیت کرافورد، تحقیقات مایکروسافت.

1. معرفی

1.1 اهداف

2 فرآیند توسعه

3 سوال و گردش کار

3.1 انگیزه

3.2 ترکیب

3.3 فرآیند جمع آوری

3.4 پیش پردازش / تمیز کردن / برچسب زدن

3.5 موارد استفاده

3.6 توزیع

3.7 تعمیر و نگهداری

4 تاثیر و چالش ها

قدردانی و مراجع

ضمیمه

4 تاثیر و چالش ها

از زمان انتشار پیش‌نویس اولیه این مقاله در مارس 2018، برگه‌های داده برای مجموعه‌های داده قبلاً در تعدادی از تنظیمات مورد توجه قرار گرفته‌اند. محققان دانشگاهی پیشنهاد ما را پذیرفته‌اند و مجموعه‌های داده را با برگه‌های داده همراه منتشر کرده‌اند [e.g., 7, 10, 23, 26]. مایکروسافت، گوگل و آی‌بی‌ام شروع به آزمایش برگه‌های داده برای مجموعه داده‌ها در داخل تیم‌های محصول کرده‌اند. محققان در گوگل کار بعدی را روی کارت‌های مدل منتشر کردند که مدل‌های یادگیری ماشین را مستند می‌کنند [20] و یک کارت داده (نسخه سبک وزن یک دیتاشیت) به همراه مجموعه داده Open Images منتشر کرد [17]. محققان IBM برگه های اطلاعاتی را پیشنهاد کردند [14] که ویژگی های مختلف را مستند می کند …

Source link