با هر کسی در هوش مصنوعی ، تجزیه و تحلیل یا علم داده صحبت کنید و آنها به شما می گویند که داده های مصنوعی آینده است. اما از آنها بپرسید که منظور آنها از “داده های مصنوعی” چیست ، و پاسخ های متفاوتی دریافت خواهید کرد. دلیل این امر این است که داده های مصنوعی فقط یک چیز نیستند – این یک دسته گسترده با موارد و تعاریف چندگانه است. و ابهام مکالمه ها را گیج کننده می کند.
بنابراین ، بیایید سر و صدا را کاهش دهیم. در هسته خود ، داده های مصنوعی در دو بعد کلیدی کار می کنند. مورد اول طیف وسیعی است که از پر کردن داده های مفقود شده در یک مجموعه داده موجود گرفته تا تولید مجموعه داده های کاملاً جدید. دوم بین مداخلات در سطح داده های خام در مقابل مداخلات در سطح بینش یا نتایج تمایز قائل می شود.
این ابعاد را به عنوان محورهای موجود در یک نمودار تصور کنید. این چهار ربع ایجاد می کند که هر کدام نوع دیگری از داده های مصنوعی را نشان می دهند: تغییر داده ها ، ایجاد کاربر ، مدل سازی بینش و نتایج تولید شدهبشر هرکدام یک عملکرد مجزا را ارائه می دهند ، و اگر با هر ظرفیتی با داده ها کار می کنید ، باید تفاوت را بدانید.
داده های داده: پر کردن خالی ها
در حالی که برخی ممکن است استدلال کنند که تغییر داده ها واقعاً داده های مصنوعی نیستند ، تکنیک های مدرن Imputation فراتر از تعویض متوسط یا متوسط تکامل یافته اند. امروز ، Advanced Imputation از یادگیری ماشین استفاده می کند و …