گذشته کلان داده با آینده ما درهم می‌آید | دانش مرکز داده

(نظر بلومبرگ) — یک راز آشکار ناخوشایند وجود دارد که در پشت بسیاری از تصمیماتی که ما هر روز می گیریم نهفته است. ما در عصری زندگی می کنیم که قدرت داده است. وقتی سفری را برنامه ریزی می کنیم، Google زمان سفر ما را تخمین می زند و مسیرهایی را بر اساس داده های ترافیک فعلی و گذشته توصیه می کند. نتفلیکس فیلم‌ها و نمایش‌هایی را که ممکن است دوست داشته باشیم بر اساس داده‌هایش از افراد با سلیقه مشابه پیشنهاد می‌کند. فدرال رزرو از داده های بازار و اقتصاد کلان برای پیش بینی تورم و آنچه باید در مورد نرخ بهره انجام دهد استفاده می کند.

راز آشکار این است که داده ها ما را برده گذشته می کند. و هنگامی که جهان تغییر می کند، داده ها دیگر چیزهای زیادی در مورد آینده به ما نمی گوید و ما می توانیم تصمیمات بدتری بگیریم. خروج از این بیماری همه گیر باعث هرج و مرج قابل توجهی شده و بسیاری از چیزها را در زندگی ما تغییر داده است. اینکه چگونه بر داده‌هایی که برای تصمیم‌گیری در آینده استفاده می‌کنیم تأثیر می‌گذارد، برای سال‌های آینده اهمیت خواهد داشت.

تا حدودی، ما همیشه برای پیش بینی آینده به داده ها اتکا کرده ایم. حتی زمانی که کاملاً آنالوگ بودیم، تجربیات گذشته ما – «داده‌های» شخصی ما – نحوه درک ریسک و انتخاب ما را هدایت می‌کرد. اما در طول قرن گذشته، قدرت محاسباتی به این معنی بود که تجربیات گذشته همه، در قالب مجموعه داده‌های بزرگ، شروع به تأثیرگذاری بر زندگی ما کرد. این امر به ویژه در امور مالی صادق بود، که قیمت اوراق بهادار را از بازارها می گرفت تا پیش بینی کند که قیمت ها در آینده کجا خواهند رفت و چگونه می توان در برابر ریسک پوشش داد یا بیمه کرد.

مشکلات بزرگ داده های بزرگ

داده‌ها به این معنی است که می‌توانیم به‌طور علمی‌تر، بر اساس تجربیات بسیار بیشتر از تجربیات خود، تصمیم‌گیری کنیم. این نوید بزرگ و دقت بیشتری را ارائه داد. بسیاری از جنبه های زندگی ما قابل پیش بینی تر و کارآمدتر شدند. نه تنها بهترین مسیر برای سفر جاده ای به ما گفته شد، بلکه رایانه ما قبل از خرید کفش می دانست که می خواهیم کدام کفش را بخریم. شرکت‌ها بهتر می‌توانستند تقاضا را پیش‌بینی کنند و کمتر برای نگهداری موجودی هزینه کنند، و خطوط هوایی می‌توانستند صندلی‌های بیشتری بفروشند، زیرا درک بهتری از اینکه چه کسی حضور خواهد داشت.

اما این روند همیشه کمتر از آن چیزی بود که به خودمان می گفتیم.

حدود 10 سال پیش، من وظیفه پیش‌بینی نرخ‌های بهره آینده را برای مدل ریسک بازنشستگی داشتم. این مشکل چالش های زیادی را به وجود آورد. معمولاً در امور مالی، داده‌های گذشته را می‌گیریم. وقتی به دفترچه صندوق نگاه می کنید، میانگین بازده و نوسانات گذشته آن را به شما می گوید. اما در سال 2011، نرخ‌های بهره ده‌ها سال در حال کاهش بود و احتمال اینکه چنین دوره‌ای دوباره تکرار نشود، به این معنی است که نرخ‌ها بسیار منفی می‌شوند. اقتصاددانان معمولاً فرض می‌کنند که نرخ‌ها به میانگین تاریخی خود بازمی‌گردند، اما هیچ نشانه‌ای وجود نداشت که به این زودی‌ها اتفاق بیفتد. جهان تغییر کرده بود، جهانی تر بود و تقاضای بیشتری برای اوراق قرضه ایالات متحده وجود داشت که باعث کاهش نرخ شد.

همه این نگرانی‌ها باعث شد این سوال را به ذهنم خطور کند که آیا می‌توانم از داده‌های نرخ تاریخی استفاده کنم، و اگر چنین است، چه سابقه‌ای؟ اگر در دهه 1980 شروع به کار می کردم، در مدل خود بازار اوراق قرضه گاو نر را ایجاد می کردم که احتمالاً دیگر تکرار نمی شود. اگر از داده‌های مربوط به دهه 1970 استفاده می‌کردم، فرض می‌کردم که نرخ‌ها به سطح بالاتری می‌روند – احتمالاً این نیز اتفاق نخواهد افتاد. در پایان، پس از بحث‌های فراوان با رهبری ارشد، تصمیم گرفتیم تا حد امکان از تاریخچه استفاده کنیم و فرآیندی را برای به‌روزرسانی مکرر داده‌های جدید ایجاد کنیم. این انتخاب محافظه‌کارانه‌تر بود، اما سخت بود.

یک جریان داده زنده و تنفسی

داده ها جایگزینی برای خرد نیست. بدون قضاوت خوب، داده ها شما را شکست خواهند داد زیرا شما را به گذشته مرتبط می کند. فرض اینکه قیمت مسکن کاهش نمی‌یابد، صرفاً به این دلیل که مدت‌ها بود کاهش نیافته بود، عامل بزرگی در بحران مالی بود. اخیراً، قضاوت ضعیف داده یکی از دلایلی بود که فدرال رزرو معتقد بود تورم گذرا است. اقتصاددانان فدرال رزرو از مدل‌های بازگشت میانگین استفاده می‌کنند که با داده‌های ۴۰ سال گذشته، تورم را به‌سرعت به‌خودی خود از بین می‌برد. تغییر داده ها یکی از دلایلی است که جستجوهای گوگل مانند گذشته مفید نیستند.

امروزه، تمرین اجازه دادن به داده ها ما را به یک خطر بزرگ تبدیل کرده است، زیرا زندگی ما بیشتر مبتنی بر داده شده است. زندگی آنلاین ما بیش از هر زمان دیگری داده تولید می کند. و قدرت محاسباتی و فناوری بیشتر استفاده از این داده ها را امکان پذیر کرد. ناگهان هر سفری که می‌رفتیم، هر چیزی که می‌خریدیم و هر وب‌سایتی که بازدید می‌کردیم به قدرت پیش‌بینی داده‌ها اضافه می‌کرد و تصمیمات ما را هدایت می‌کرد – حتی اگر همه چیز کمی ترسناک بود.

اما حتی داده های قدرتمند بزرگ نیز مربوط به گذشته است. و اکنون جهان تغییر کرده است و همه این داده ها دیگر چندان قابل پیش بینی نیستند. تورم برگشته و نحوه خرید و خرید ما را تغییر می دهد. نرخ بهره در حال افزایش است و نحوه پس‌انداز، سرمایه‌گذاری و خرید خانه را تغییر می‌دهد. و این فقط اقتصاد نیست. الگوهای ترافیکی سال 2019 – زمانی که مردم پنج روز در هفته سر کار می‌رفتند – دیگر چندان مفید نیستند، و همچنین پیش‌بینی‌هایی در مورد لباس‌هایی که ما نیاز خواهیم داشت، وجود ندارد. در خانه فیلم های بیشتری می بینیم و زودتر بیرون غذا می خوریم. سفرهای تفریحی به پایان رسیده است، اما هنوز سفرهای کاری کمتری وجود دارد، که این امر باعث می‌شود خطوط هوایی نتوانند تعداد صندلی‌های خود را بفروشند.

اقتصاد امروز به دلایل زیادی – در درجه اول کمبود عرضه و نیروی کار – آشفته است، بنابراین سخت است که بدانیم الگوریتم‌های مبتنی بر داده‌های ما چقدر ما را شکست می‌دهند. اگر جهان واقعاً تغییر کرده باشد، ممکن است سال‌ها طول بکشد تا داده‌های معنی‌داری در اختیار داشته باشیم تا دوباره تصمیم‌هایمان را تقویت کنیم. یا اگر به حالت عادی برگردد، از کدام سال های همه گیر باید در آینده استفاده کنیم؟

این غیرعادی است که دنیا در مدت زمان کوتاهی اینقدر تغییر کند، اما درس ارزشمندی ارائه می دهد که احتمالاً فراموش خواهیم کرد: داده ها فقط یک راهنما هستند و هرگز جایگزینی برای قضاوت خود ما نمی شوند. در ادامه، باید همه پیش‌بینی‌های بزرگ و کوچک را با کمی شک و تردید در نظر بگیریم و آنها را با تجربه شخصی خود متعادل کنیم.