مقدمه ای برای CDC (تغییر ضبط داده ها)
تغییر ضبط داده (CDC) روشی است که برای ردیابی تغییرات در سطح ردیف در عملیات پایگاه داده (درج ، به روزرسانی ، حذف) استفاده می شود و به ترتیب وقایع به سایر سیستم ها اطلاع می دهد. در سناریوهای بازیابی فاجعه ، CDC در درجه اول داده ها را بین یک بانک اطلاعاتی اولیه و پشتیبان همگام می کند ، و امکان همگام سازی داده های زمان واقعی از پایگاه داده اولیه به ثانویه را فراهم می کند.
source ---------- CDC ---------- sink
CDC Apache Seatunnel CDC
CDC Seatunnel دو نوع هماهنگ سازی داده را ارائه می دهد:
- عکس فوری خوانده شده: داده های تاریخی را از یک جدول می خواند.
- ردیابی افزایشی: تغییرات ورود به سیستم افزایشی را از یک جدول می خواند.
همگام سازی عکس فوری بدون قفل
مرحله همگام سازی عکس فوری بدون قفل تأکید می شود زیرا بسیاری از سیستم عامل های CDC موجود ، مانند DeBezium ، ممکن است جداول را در طول همگام سازی داده های تاریخی قفل کنند. خواندن عکس فرایند همگام سازی داده های تاریخی یک پایگاه داده است. جریان اساسی این فرآیند به شرح زیر است:
storage ------------- splitEnumerator ---------- split ---------- reader
^ |
| |
\----------------- report -----------/
تقسیم بندی تقسیم
splitEnumerator
(تقسیم …