نحوه ایجاد دیتاشیت های دقیق برای مجموعه داده های هوش مصنوعی

نویسندگان:

(1) TIMNIT GEBRU، سیاه در هوش مصنوعی.

(2) جیمی مورگنسترن، دانشگاه واشنگتن.

(3) BRIANA VECCHIONE، دانشگاه کرنل.

(4) JENNIFER WORTMAN VAUGHAN، Microsoft Research;

(5) HANNA WALLACH، Microsoft Research;

(6) HAL DAUMÉ III، Microsoft Research; دانشگاه مریلند؛

(7) کیت کرافورد، تحقیقات مایکروسافت.

1. معرفی

1.1 اهداف

2 فرآیند توسعه

3 سوال و گردش کار

3.1 انگیزه

3.2 ترکیب

3.3 فرآیند جمع آوری

3.4 پیش پردازش / تمیز کردن / برچسب زدن

3.5 موارد استفاده

3.6 توزیع

3.7 تعمیر و نگهداری

4 تاثیر و چالش ها

قدردانی و مراجع

ضمیمه

3 سوال و گردش کار

در این بخش، مجموعه‌ای از سؤالات را ارائه می‌کنیم که برای استخراج اطلاعاتی که ممکن است یک دیتاشیت برای یک مجموعه داده باشد، و همچنین یک گردش کار برای سازندگان مجموعه داده‌ها برای استفاده در هنگام پاسخ دادن به این سؤالات، ارائه می‌کنیم. سؤالات در بخش هایی دسته بندی می شوند که تقریباً با مراحل کلیدی چرخه زندگی مجموعه داده مطابقت دارند: انگیزه، ترکیب، فرآیند جمع آوری، پیش پردازش / تمیز کردن / برچسب گذاری، استفاده، توزیع و نگهداری. این گروه بندی سازندگان مجموعه داده را تشویق می کند تا در مورد فرآیند ایجاد، توزیع و نگهداری یک مجموعه داده فکر کنند و حتی این فرآیند را در پاسخ به بازتاب خود تغییر دهند. توجه داشته باشیم که همه سوالات قابل اجرا نیستند…

Source link