تضمین سلامت مجموعه داده ها: استراتژی هایی برای نگهداری و پشتیبانی موثر

نویسندگان:

(1) TIMNIT GEBRU، سیاه در هوش مصنوعی.

(2) جیمی مورگنسترن، دانشگاه واشنگتن.

(3) BRIANA VECCHIONE، دانشگاه کرنل.

(4) JENNIFER WORTMAN VAUGHAN، Microsoft Research;

(5) HANNA WALLACH، Microsoft Research;

(6) HAL DAUMÉ III، Microsoft Research; دانشگاه مریلند؛

(7) کیت کرافورد، تحقیقات مایکروسافت.

1. معرفی

1.1 اهداف

2 فرآیند توسعه

3 سوال و گردش کار

3.1 انگیزه

3.2 ترکیب

3.3 فرآیند جمع آوری

3.4 پیش پردازش / تمیز کردن / برچسب زدن

3.5 موارد استفاده

3.6 توزیع

3.7 تعمیر و نگهداری

4 تاثیر و چالش ها

قدردانی و مراجع

ضمیمه

3.7 تعمیر و نگهداری

همانند سؤالات بخش قبل، سازندگان مجموعه داده باید قبل از توزیع مجموعه داده، به این سؤالات پاسخ دهند. سؤالات این بخش برای تشویق سازندگان مجموعه داده به برنامه ریزی برای نگهداری مجموعه داده ها و انتقال این طرح به مصرف کنندگان مجموعه داده است.

• چه کسی مجموعه داده را پشتیبانی/میزبان/نگهداری خواهد کرد؟

• چگونه می توان با مالک / متصدی / مدیر مجموعه داده تماس گرفت (به عنوان مثال، آدرس ایمیل)؟

• آیا اشتباهی وجود دارد؟ اگر چنین است، لطفاً یک پیوند یا نقطه دسترسی دیگر ارائه دهید.

• آیا مجموعه داده به روز می شود (به عنوان مثال، برای تصحیح خطاهای برچسب گذاری، افزودن نمونه های جدید، حذف نمونه ها)؟ اگر چنین است، لطفاً توضیح دهید که چند بار، توسط چه کسی و…

Source link