در عرض 10 دقیقه با آپاچی آیس‌برگ و Dremio روی لپ‌تاپ خود کار کنید

مدیریت و تجزیه و تحلیل کارآمد داده ها برای موفقیت کسب و کار ضروری است و معماری lakehouse داده ها راه را برای آسان تر و مقرون به صرفه تر می کند. با ترکیب انعطاف پذیری دریاچه های داده با عملکرد ساختاریافته انبارهای داده، Lakehouse ها راه حلی قدرتمند برای ذخیره سازی داده ها، پرس و جو و حاکمیت ارائه می دهند.

برای این راهنمای عملی، ما فقط در ده دقیقه با استفاده از لپ‌تاپ خود یک خانه داده روی لپ‌تاپ راه‌اندازی می‌کنیم. Dremio، نسی، و کوه یخ آپاچی. این راه‌اندازی به شما امکان می‌دهد تا تجزیه‌وتحلیل‌های یکپارچه را روی داده‌های خود انجام دهید و از رویکردی شبیه به Git برای مدیریت داده‌ها با سطل‌های ذخیره‌سازی از پیش پیکربندی شده برای سادگی استفاده کنید.

ابزارهایی که استفاده خواهیم کرد:

  • Dremio: یک پلتفرم lakehouse که داده‌ها را از پایگاه‌های داده، انبارهای داده، دریاچه‌های داده و کاتالوگ‌های lakehouse در یک لایه معنایی یکپارچه سازمان‌دهی، مستندسازی و جستجو می‌کند و دسترسی یکپارچه به داده‌ها را برای تجزیه و تحلیل و گزارش فراهم می‌کند.
  • نسی: کاتالوگ تراکنشی که قابلیت‌های انشعاب و ادغام مانند Git را برای داده‌ها فعال می‌کند و امکان آزمایش و کنترل نسخه را آسان‌تر می‌کند.
  • کوه یخ آپاچی: قالب جدول داده lakehouse که دریاچه داده شما را به ساختاری مطابق با ACID تبدیل می‌کند و از عملیات‌هایی مانند سفر در زمان، تکامل طرح‌واره و پارتیشن‌بندی پیشرفته پشتیبانی می‌کند.

توسط…

Source link