7 مهندس داده Gotpat (!) باید در یک پروژه ML مراقب آن باشند

عکس پروفایل نویسنده

@sandeepuسندیپ اوتامچاندانی

داده + AI / ML – هم یک نرم افزار سازنده و هم رهبر در ابتکارات داده / AI در کل شرکت | نویسنده کتاب اورلی

خبر فلاش: 87٪ از پروژه های ML شکست خورده است!

این مقاله شامل 7 مقاله برتر مهندسی داده در یک پروژه ML است. لیست بر اساس تعداد دفعاتی که من با مسئله روبرو شده ام در ضرب تأثیر هر رویداد بر کل پروژه مرتب شده است ، مرتب می شود.

1 “من فکر کردم این ویژگی Dataset است به معنای چیزی است دیگری

قبل از عصر داده های بزرگ ، داده ها قبل از افزودن به انبار داده مرکزی ، گردآوری می شدند. این به عنوان طرح نوشتن شناخته می شود. امروزه ، رویکرد با دریاچه داده ها ابتدا جمع آوری داده ها و سپس استنباط معنای داده ها در زمان مصرف است. این به عنوان طرح خواندن شناخته می شود.

به عنوان یک مهندس داده ، استفاده از مجموعه داده ها بدون اسناد مناسب از جزئیات ویژگی یا یک مدیر داده واضح و مسئول برای به روز نگه داشتن جزئیات ، احتیاط کنید!

2 “5 تعریف برای معیار تجاری مشابه وجود دارد – کدام یک را استفاده کنید”

داده ها یا معیارهای مشتق شده می توانند چندین منبع حقیقت داشته باشند!

به عنوان مثال ، من حتی معیارهای اساسی مانند “تعداد مشتری های جدید” را دیده ام که دارای تعریف های متعددی در واحدهای تجاری است. به عنوان مهندس داده ، اگر از معیار تجاری در مدل استفاده می شود ، اطمینان حاصل کنید که به دنبال همه …

سئو PBN | خبر های جدید سئو و هک و سرور