معماری یک دریاچه داده مدرن در دنیای پس از هادوپ

را دیتالیک مدرن یک دوم انبار داده و یک دوم دریاچه داده است و از ذخیره سازی اشیا برای همه چیز استفاده می کند. استفاده از ذخیره سازی اشیاء برای ساخت انبار داده توسط فرمت های جدول باز (OTF) مانند Apache Iceberg، Apache Hudi و Delta Lake امکان پذیر شده است، که مشخصاتی هستند که پس از پیاده سازی، ذخیره سازی اشیاء را بدون مشکل می کنند تا به عنوان راه حل ذخیره سازی اساسی برای یک انبار داده این مشخصات همچنین ویژگی هایی را ارائه می دهند که ممکن است در یک انبار داده معمولی وجود نداشته باشند – به عنوان مثال، عکس های فوری (همچنین به عنوان سفر در زمان شناخته می شود)، تکامل طرحواره، پارتیشن ها، تکامل پارتیشن، و انشعاب صفر کپی.

همانطور که سازمان‌ها Datalakes مدرن می‌سازند، در اینجا برخی از عوامل کلیدی که فکر می‌کنیم باید در نظر بگیرند آورده شده است:

  1. تفکیک محاسبات و ذخیره سازی
  2. مهاجرت از چارچوب های یکپارچه به چارچوب های برتر
  3. ادغام مرکز داده – راه حل های بخش را با یک راه حل شرکتی جایگزین کنید
  4. عملکرد بدون درز در فایل ها/اشیاء کوچک و بزرگ
  5. راه حل های مبتنی بر نرم افزار تعریف شده و بومی ابری که به صورت افقی مقیاس می شوند

این مقاله درباره ظهور و سقوط Hadoop HDFS و اینکه چرا ذخیره سازی اشیاء با کارایی بالا جانشین طبیعی در دنیای داده های بزرگ است صحبت می کند.

پذیرش هادوپ

با گسترش اپلیکیشن های اینترنتی، اولین داده های بزرگ…

Source link