تراز کردن معماری داده با بهینه سازی هزینه ابر | دانش مرکز داده

یکی از مزایای کلیدی رایانش ابری این است که معماری های ذخیره سازی داده را ارائه می دهد که دارای پتانسیل انعطاف پذیری بسیار بالا و هزینه بسیار پایین هستند.

اما کلمه کلیدی وجود دارد پتانسیل: اینکه آیا نحوه ذخیره داده ها در فضای ابری واقعاً باعث صرفه جویی در هزینه و ایجاد انعطاف پذیری می شود تا حد زیادی به تصمیمات مهم معماری داده بستگی دارد که در اوایل کار خود می گیرید. سفر مهاجرت ابر.

برای اثبات این موضوع، این مقاله پیامدهای هزینه معماری‌های مختلف داده در ابر را باز می‌کند و راهنمایی می‌کند که استراتژی‌های ذخیره‌سازی، مدیریت و پردازش داده مبتنی بر ابر بهترین بازگشت سرمایه را به همراه دارد.

معماری داده چیست؟

معماری داده یک اصطلاح جامع است که روش های مختلفی را که اپراتورها می توانند به داده ها دسترسی پیدا کرده و آن ها را تجزیه و تحلیل کنند، توصیف می کند. این شامل اقداماتی مانند (اما نه لزوماً محدود به) موارد زیر است:

  • ذخیره سازی داده ها
  • تبدیل داده ها.
  • تجزیه و تحلیل داده ها
  • مدیریت کیفیت داده ها
  • حفظ و چرخش داده ها.
  • پشتیبان گیری و بازیابی اطلاعات

تکنیک‌ها و ابزارهایی که برای رسیدگی به این نیازها استفاده می‌کنید، و همچنین نحوه ادغام آن تکنیک‌ها و ابزارها، اساس معماری داده‌های شما را تشکیل می‌دهد.

نقش معماری داده در هزینه های رایانش ابری

روشی که شما داده‌های خود را طراحی می‌کنید، روی نتیجه شما در هر نوع محیط فناوری اطلاعات تأثیر می‌گذارد، زیرا سخت‌افزار و نرم‌افزار مورد نیاز برای ذخیره، پردازش و مدیریت داده‌ها هزینه دارد.

با این حال، در فضای ابری، معماری داده به دلیل ماهیت منحصر به فرد خدمات ابری و مدل‌های صورت‌حساب، پیامدهای ویژه‌ای برای هزینه کلی دارد. هزینه های اضافی برای معماری داده مبتنی بر ابر عبارتند از:

  • هزینه های خروج، هزینه هایی هستند که ارائه دهندگان ابر هنگام خروج داده ها از ابر تحمیل می کنند. (بیشتر ارائه دهندگان برای انتقال داده ها به پلتفرم های ابری خود هزینه ای دریافت نمی کنند.)
  • هزینه های درخواست داده، که در برخی موارد هنگام تعامل با داده ها باید پرداخت کنید. برای مثال، سرویس ذخیره‌سازی داده‌های آمازون S3 برای اقداماتی مانند کپی کردن داده‌ها، هزینه‌هایی را دریافت می‌کند.
  • هزینه های حذف زود هنگام، که در صورت حذف داده ها قبل از یک دوره توافق شده، برای برخی از سرویس های ذخیره سازی ابری تحت تنظیمات خاصی اعمال می شود. به عنوان مثال، لایه Glacier ذخیره سازی آمازون S3 دارد هزینه های حذف زودهنگام.
  • هزینه های پردازش و تجزیه و تحلیل داده ها که هنگام استفاده از خدمات مبتنی بر ابر جمع می شوند. معمولاً این هزینه ها بر اساس میزان داده ای که در ابزارها وارد می کنید تعیین می شود.

در بیشتر موارد، این هزینه ها – حداقل نه به طور مستقیم – در محیط داخلی اعمال نمی شود. برای مثال، در پریم، مجبور نیستید برای خروج داده یا حذف زودهنگام هزینه ای بپردازید.

معماری داده های ابری بهینه سازی شده

بسیار عالی خواهد بود اگر هنگام طراحی معماری داده های ابری از قوانین ساده ای پیروی کنید که تضمین کند هرگز بیش از حد لازم برای ذخیره سازی، پردازش و مدیریت داده ها پرداخت نمی کنید. متأسفانه، با توجه به نیازهای داده‌ای متفاوت سازمان‌های مختلف، هیچ رویکرد یکسانی برای بهینه‌سازی هزینه معماری داده‌های ابری شما وجود ندارد.

اما برخی از بهترین روش‌های کلی وجود دارد که می‌تواند به هدایت سازمان‌ها به سمت مدیریت داده‌های ابری کم‌هزینه کمک کند:

  • هزینه های داده ابری را درک کنید: شاید مهم‌ترین قدم برای کاهش هزینه‌های داده در فضای ابری، درک ساختارهای پیچیده هزینه‌ای باشد که برای ذخیره‌سازی داده‌ها و سرویس‌های تحلیلی مورد استفاده شما اعمال می‌شود. نادیده گرفتن یا دست کم گرفتن هزینه ها مانند هزینه های خروج آسان است، زیرا بر اساس هر گیگابایت، هزینه ها بسیار پایین است. اما آنها می توانند جمع شوند، و شما می خواهید بدانید که قبل از رسیدن صورت حسابتان چه چیزی را پرداخت خواهید کرد.
  • داده ها را ادغام کنید: به طور کلی، هرچه داده های کمتری ذخیره و پردازش کنید، هزینه های شما کمتر خواهد بود، زیرا بیشتر هزینه های داده در فضای ابری بر اساس حجم است. بنابراین، ادغام مجموعه‌های داده متمایز و حذف داده‌های اضافی می‌تواند به شما در صرفه‌جویی در هزینه کمک کند، زیرا حجم کلی داده‌های شما را کاهش می‌دهد.
  • سیاست های حفظ داده را تنظیم کنید: هزینه پایین سرویس‌های ذخیره‌سازی داده‌های ابری می‌تواند حفظ داده‌ها را برای همیشه در ابر یا انجام حذف‌های دوره‌ای و یک‌باره وسوسه‌انگیز کند. اما این یک اشتباه است. اکثر داده ها باید به طور سیستماتیک حذف شوند، زمانی که دیگر مورد نیاز نیستند. برای اطمینان از اینکه هرگز برای ذخیره‌سازی داده‌ها بیش از زمان لازم هزینه نمی‌کنید، سیاست‌های حفظ داده‌ها را تعیین کنید که مدت زمان لازم برای نگهداری داده‌ها را مشخص می‌کند. همچنین می‌توانید از ابزارهایی مانند سیاست‌های S3 Lifecycle برای حذف خودکار داده‌ها پس از پایان دوره نگهداری آن استفاده کنید.
  • خدمات تجزیه و تحلیل داده های ابری را مقایسه کنید: بازار تجزیه و تحلیل داده مبتنی بر ابر در دهه گذشته رشد کرد. نه تنها هر ابر عمومی بزرگ اکنون مجموعه ای از ابزارهای تحلیلی مختلف را ارائه می دهد، بلکه ارائه دهندگان شخص ثالث مختلف نیز می توانند داده های شما را پردازش و تجزیه و تحلیل کنند. قبل از پیش‌فرض هر سرویس تجزیه و تحلیل داده‌ای که راحت‌تر در دسترس است، ویژگی‌ها و قیمت‌های فروشندگان مختلف را مقایسه کنید تا مطمئن شوید که بهترین معامله را دریافت می‌کنید. و از آن نترسید چند ابری رفتن اگر داده‌ها را در یک ابر ذخیره می‌کنید، اما می‌توانید سرویس تجزیه و تحلیل داده بهتری را از یک ابر دیگر دریافت کنید. (با این حال، به یاد داشته باشید که برای انتقال داده ها بین ابرها هزینه خروج پرداخت می کنید.)

نتیجه

همه می خواهند هزینه کار با داده ها را به حداقل برسانند. اما پیچیدگی ابزارهای ابری و مدل‌های صورت‌حساب – و بسیاری از خدمات مختلف موجود برای کار با داده‌ها در فضای ابری – در بسیاری از موارد مشخص می‌کند که کدام معماری داده مبتنی بر ابر بهترین عملکرد را با کمترین هزینه داشته باشد. با این حال، با ارزیابی دقیق عواملی مانند هزینه‌های پردازش داده که به راحتی نادیده گرفته می‌شوند، و با اتخاذ یک رویکرد سیستماتیک و خودکار برای مدیریت داده‌های ابری، می‌توانید معماری داده‌های خود را تا حد امکان مقرون به صرفه کنید.