برای ادامه
یک سیستم استریم یا سیستم پردازش جریانی، داده ها را در زمان تولید یا دریافت آن ها پردازش می کند. برخلاف پردازش دستهای، که دادهها را در تکههای بزرگ و مجزا مدیریت میکند، سیستمهای استریم دادهها را به صورت یک جریان پیوسته مدیریت میکنند و امکان تجزیه و تحلیل و اقدام فوری را فراهم میکنند.
داده های محدود نشان دهنده مجموعه داده های محدود با شروع و پایان واضح است و اغلب برای پردازش دسته ای مناسب تر است (مانند فایل ها، پایگاه های داده، سوابق تاریخی). پردازش داده های محدود ساده تر و قابل پیش بینی تر است، اما ممکن است تاخیر ایجاد کند، به خصوص برای مجموعه داده های بزرگ.
دادههای نامحدود به جریانهای پیوسته دادههای تولید شده از منابعی اطلاق میشود که برای بینشهای بهموقع نیاز به پردازش زمان واقعی یا تقریباً واقعی دارند. چارچوبهای پردازش جریانی مانند Apache Kafka، Apache Flink، Apache Storm و دیگران برای مدیریت دادههای نامحدود طراحی شدهاند که راهحلهایی با تأخیر کم، مقیاسپذیر و مقاوم در برابر خطا ارائه میدهند.
در زمینه پردازش جریانی، زمان رویداد و زمان پردازش دو مفهوم مهم هستند که به مهرهای زمانی مختلف مرتبط با داده ها اشاره دارند:
زمان رویداد
زمانی که یک رویداد در واقع رخ می دهد، همانطور که توسط منبع ثبت شده است. این مهر زمانی…