این روزها، به نظر میرسد هر شرکتی مشتاق است نقش «دانشمند داده» را ایفا کند و فرصتهای هیجانانگیزی برای کار با الگوریتمهای یادگیری ماشین، مدلهای پیشبینیکننده و چارچوبهای یادگیری عمیق را نوید میدهد. با این حال، برای بسیاری از حرفه ای ها که در این موقعیت ها قدم می گذارند، واقعیت کاملاً با جذابیت مطابقت ندارد. آنها بهجای غواصی در هوش مصنوعی یا مدلسازی مجموعههای داده پیچیده، خود را تا زانو در استخراج، تمیز کردن و آمادهسازی دادهها میبینند. به دنیای مهندسی داده خوش آمدید – دامنه ای که بسیاری متوجه نشدند در آن ثبت نام کرده اند.
این پدیده ناشی از سوء تفاهم اساسی شرکت ها از آنچه واقعاً به آن نیاز دارند، می باشد. زمانی که بخش عمده ای از کارشان شامل پاکسازی داده ها و اطمینان از وجود زیرساخت ها برای رسیدگی به آن ها می شود – اساساً وظایف مهندسی داده، آنها لیست های شغلی را برای “دانشمندان داده” ارسال می کنند. نتیجه این است که متخصصانی که بهعنوان دانشمندان داده استخدام میشوند، در نهایت کاری را انجام میدهند که انتظارش را نداشتند: دادههای آشفته، جابجایی آنها بین پلتفرمها و آمادهسازی آنها برای تجزیه و تحلیل. ناامیدی ناگزیر برای کسانی ایجاد می شود که انتظار داشتند روز خود را صرف ساختن مدل های یادگیری ماشین کنند، نه نوشتن پرس و جوهای SQL و راه اندازی خطوط لوله.
برای مهندسان مشتاق داده، این یک فرصت پنهان است. در حالی که بازار کار پر از شرکت هایی است که به دنبال …