آیا پایگاه های داده NoSQL برای مهندسی داده ها مناسب هستند؟

عکس پروفایل نویسنده

@taavi-rehemagiTaavi Rehemägi

مدیر عامل شرکت Dashbird. 13 سال تجربه به عنوان یک توسعه دهنده نرم افزار و 5 سال ساخت برنامه های بدون سرور.

SQL عالی است ، اما گاهی اوقات ممکن است به چیز دیگری نیاز داشته باشید.

به طور کلی ، نوع شایع داده ای که مهندسان داده به طور منظم با آن سر و کار دارند ، است رابطه ای. جداول موجود در انبار داده ، داده های معاملاتی در پایگاه داده پردازش معاملات آنلاین (OLTP) – همه آنها می توانند با استفاده از SQL پرس و جو شده و قابل دسترسی است. اما آیا این بدان معناست که NoSQL برای مهندسی داده بی ربط است؟ در این مقاله ، ما بررسی خواهیم کرد موارد استفاده کنید برای کدام ممکن است مهندسان داده نیاز به تعامل با ذخیره داده های NoSQL داشته باشند.

دلایل NoSQL

این روزها ، داده ها در چنین مواردی ذخیره می شوند سرعت ، حجم و تنوع (به طور خلاصه: داده های بزرگ) که بسیاری از سیستم های پایگاه داده رابطه ای قادر به ادامه آن نیستند. از نظر تاریخی ، این دلیل اصلی بود که شرکت های بزرگ فناوری راه حل های NoSQL خود را برای کاهش این مشکلات ایجاد کردند. در سال 2006 ، گوگل آنها را منتشر كرد میز بزرگ کاغذی که پایه های منبع باز را بنا نهاد HBase ذخیره داده NoSQL و GCP ابر بزرگ. در سال 2007 ، آمازون راه حل جایگزین خود را با دینامو کاغذ.

از آن زمان به بعد ، سایر سیستم های پایگاه داده توزیع شده NoSQL مدام در حال ظهور بودند. همه آنها عمدتا در تلاشند مسئله مقیاس را کاهش دهند …