مدیریت و تجزیه و تحلیل کارآمد داده ها برای موفقیت کسب و کار ضروری است و معماری lakehouse داده ها راه را برای آسان تر و مقرون به صرفه تر می کند. با ترکیب انعطاف پذیری دریاچه های داده با عملکرد ساختاریافته انبارهای داده، Lakehouse ها راه حلی قدرتمند برای ذخیره سازی داده ها، پرس و جو و حاکمیت ارائه می دهند.
برای این راهنمای عملی، ما فقط در ده دقیقه با استفاده از لپتاپ خود یک خانه داده روی لپتاپ راهاندازی میکنیم. Dremio، نسی، و کوه یخ آپاچی. این راهاندازی به شما امکان میدهد تا تجزیهوتحلیلهای یکپارچه را روی دادههای خود انجام دهید و از رویکردی شبیه به Git برای مدیریت دادهها با سطلهای ذخیرهسازی از پیش پیکربندی شده برای سادگی استفاده کنید.
ابزارهایی که استفاده خواهیم کرد:
- Dremio: یک پلتفرم lakehouse که دادهها را از پایگاههای داده، انبارهای داده، دریاچههای داده و کاتالوگهای lakehouse در یک لایه معنایی یکپارچه سازماندهی، مستندسازی و جستجو میکند و دسترسی یکپارچه به دادهها را برای تجزیه و تحلیل و گزارش فراهم میکند.
- نسی: کاتالوگ تراکنشی که قابلیتهای انشعاب و ادغام مانند Git را برای دادهها فعال میکند و امکان آزمایش و کنترل نسخه را آسانتر میکند.
- کوه یخ آپاچی: قالب جدول داده lakehouse که دریاچه داده شما را به ساختاری مطابق با ACID تبدیل میکند و از عملیاتهایی مانند سفر در زمان، تکامل طرحواره و پارتیشنبندی پیشرفته پشتیبانی میکند.
توسط…