نحوه شروع به کار با کنترل نسخه داده (DVC)

عکس پروفایل نویسنده

کنترل نسخه داده چیست؟

یکی از شگفتی های توسعه نرم افزار ، اختراع Git است. با Git می توانید نسخه های مختلف پایگاه کد خود را مدیریت کنید. مزیت این کار این است که شما می توانید با اطمینان به این نکته که در صورت خراب شدن مشکلات همیشه می توانید به نسخه قبلی کار برگردید ، تغییراتی را در کد وارد کرده و آزمایش کنید.

یکی دیگر از مزایای Git نسیم همکاری است. یک پروژه می تواند در اطراف یک مخزن مرکزی سازماندهی شود. هر توسعه دهنده یا زیرگروهی که روی ویژگی خاصی کار می کند می تواند از طریق یک شاخه خاص تغییرات را به آن مخزن هدایت کند. به این مزیت Github و Gitlab اضافه شده است ، جایی که می توان مخازن پروژه را از راه دور مدیریت کرد.

دانشمندان و مهندسان داده برای داده های خود نیازهای یکسانی دارند. آنها باید راهی برای مدیریت نسخه های مختلف داده ها و همکاری داشته باشند. از نظر فنی ، گیت می تواند کار را انجام دهد. با این حال ، به چند دلیل ایده آل نیست:

  • هل دادن و بیرون کشیدن مقادیر عظیم داده می تواند یک گلوگاه باشد.
  • بررسی تغییرات می تواند دست و پا گیر باشد (هنوز هم به دلیل حجم زیاد داده ها)
  • هر مخزن محلی یا از راه دور فضای دیسک را مسدود می کند.

اینجاست که Data Version Control (DVC) وارد سیستم می شود. به بیان ساده ، DVC یک نسخه Git متمرکز بر داده است. در واقع ، از نظر ویژگی ها و گردش کار مرتبط با آن تقریباً دقیقاً مانند Git است.

در حالی که…

سئو PBN | خبر های جدید سئو و هک و سرور