یکی از مزایای کلیدی رایانش ابری این است که معماری های ذخیره سازی داده را ارائه می دهد که دارای پتانسیل انعطاف پذیری بسیار بالا و هزینه بسیار پایین هستند.
اما کلمه کلیدی وجود دارد پتانسیل: اینکه آیا نحوه ذخیره داده ها در فضای ابری واقعاً باعث صرفه جویی در هزینه و ایجاد انعطاف پذیری می شود تا حد زیادی به تصمیمات مهم معماری داده بستگی دارد که در اوایل کار خود می گیرید. سفر مهاجرت ابر.
برای اثبات این موضوع، این مقاله پیامدهای هزینه معماریهای مختلف داده در ابر را باز میکند و راهنمایی میکند که استراتژیهای ذخیرهسازی، مدیریت و پردازش داده مبتنی بر ابر بهترین بازگشت سرمایه را به همراه دارد.
معماری داده چیست؟
معماری داده یک اصطلاح جامع است که روش های مختلفی را که اپراتورها می توانند به داده ها دسترسی پیدا کرده و آن ها را تجزیه و تحلیل کنند، توصیف می کند. این شامل اقداماتی مانند (اما نه لزوماً محدود به) موارد زیر است:
- ذخیره سازی داده ها
- تبدیل داده ها.
- تجزیه و تحلیل داده ها
- مدیریت کیفیت داده ها
- حفظ و چرخش داده ها.
- پشتیبان گیری و بازیابی اطلاعات
تکنیکها و ابزارهایی که برای رسیدگی به این نیازها استفاده میکنید، و همچنین نحوه ادغام آن تکنیکها و ابزارها، اساس معماری دادههای شما را تشکیل میدهد.
نقش معماری داده در هزینه های رایانش ابری
روشی که شما دادههای خود را طراحی میکنید، روی نتیجه شما در هر نوع محیط فناوری اطلاعات تأثیر میگذارد، زیرا سختافزار و نرمافزار مورد نیاز برای ذخیره، پردازش و مدیریت دادهها هزینه دارد.
با این حال، در فضای ابری، معماری داده به دلیل ماهیت منحصر به فرد خدمات ابری و مدلهای صورتحساب، پیامدهای ویژهای برای هزینه کلی دارد. هزینه های اضافی برای معماری داده مبتنی بر ابر عبارتند از:
- هزینه های خروج، هزینه هایی هستند که ارائه دهندگان ابر هنگام خروج داده ها از ابر تحمیل می کنند. (بیشتر ارائه دهندگان برای انتقال داده ها به پلتفرم های ابری خود هزینه ای دریافت نمی کنند.)
- هزینه های درخواست داده، که در برخی موارد هنگام تعامل با داده ها باید پرداخت کنید. برای مثال، سرویس ذخیرهسازی دادههای آمازون S3 برای اقداماتی مانند کپی کردن دادهها، هزینههایی را دریافت میکند.
- هزینه های حذف زود هنگام، که در صورت حذف داده ها قبل از یک دوره توافق شده، برای برخی از سرویس های ذخیره سازی ابری تحت تنظیمات خاصی اعمال می شود. به عنوان مثال، لایه Glacier ذخیره سازی آمازون S3 دارد هزینه های حذف زودهنگام.
- هزینه های پردازش و تجزیه و تحلیل داده ها که هنگام استفاده از خدمات مبتنی بر ابر جمع می شوند. معمولاً این هزینه ها بر اساس میزان داده ای که در ابزارها وارد می کنید تعیین می شود.
در بیشتر موارد، این هزینه ها – حداقل نه به طور مستقیم – در محیط داخلی اعمال نمی شود. برای مثال، در پریم، مجبور نیستید برای خروج داده یا حذف زودهنگام هزینه ای بپردازید.
معماری داده های ابری بهینه سازی شده
بسیار عالی خواهد بود اگر هنگام طراحی معماری داده های ابری از قوانین ساده ای پیروی کنید که تضمین کند هرگز بیش از حد لازم برای ذخیره سازی، پردازش و مدیریت داده ها پرداخت نمی کنید. متأسفانه، با توجه به نیازهای دادهای متفاوت سازمانهای مختلف، هیچ رویکرد یکسانی برای بهینهسازی هزینه معماری دادههای ابری شما وجود ندارد.
اما برخی از بهترین روشهای کلی وجود دارد که میتواند به هدایت سازمانها به سمت مدیریت دادههای ابری کمهزینه کمک کند:
- هزینه های داده ابری را درک کنید: شاید مهمترین قدم برای کاهش هزینههای داده در فضای ابری، درک ساختارهای پیچیده هزینهای باشد که برای ذخیرهسازی دادهها و سرویسهای تحلیلی مورد استفاده شما اعمال میشود. نادیده گرفتن یا دست کم گرفتن هزینه ها مانند هزینه های خروج آسان است، زیرا بر اساس هر گیگابایت، هزینه ها بسیار پایین است. اما آنها می توانند جمع شوند، و شما می خواهید بدانید که قبل از رسیدن صورت حسابتان چه چیزی را پرداخت خواهید کرد.
- داده ها را ادغام کنید: به طور کلی، هرچه داده های کمتری ذخیره و پردازش کنید، هزینه های شما کمتر خواهد بود، زیرا بیشتر هزینه های داده در فضای ابری بر اساس حجم است. بنابراین، ادغام مجموعههای داده متمایز و حذف دادههای اضافی میتواند به شما در صرفهجویی در هزینه کمک کند، زیرا حجم کلی دادههای شما را کاهش میدهد.
- سیاست های حفظ داده را تنظیم کنید: هزینه پایین سرویسهای ذخیرهسازی دادههای ابری میتواند حفظ دادهها را برای همیشه در ابر یا انجام حذفهای دورهای و یکباره وسوسهانگیز کند. اما این یک اشتباه است. اکثر داده ها باید به طور سیستماتیک حذف شوند، زمانی که دیگر مورد نیاز نیستند. برای اطمینان از اینکه هرگز برای ذخیرهسازی دادهها بیش از زمان لازم هزینه نمیکنید، سیاستهای حفظ دادهها را تعیین کنید که مدت زمان لازم برای نگهداری دادهها را مشخص میکند. همچنین میتوانید از ابزارهایی مانند سیاستهای S3 Lifecycle برای حذف خودکار دادهها پس از پایان دوره نگهداری آن استفاده کنید.
- خدمات تجزیه و تحلیل داده های ابری را مقایسه کنید: بازار تجزیه و تحلیل داده مبتنی بر ابر در دهه گذشته رشد کرد. نه تنها هر ابر عمومی بزرگ اکنون مجموعه ای از ابزارهای تحلیلی مختلف را ارائه می دهد، بلکه ارائه دهندگان شخص ثالث مختلف نیز می توانند داده های شما را پردازش و تجزیه و تحلیل کنند. قبل از پیشفرض هر سرویس تجزیه و تحلیل دادهای که راحتتر در دسترس است، ویژگیها و قیمتهای فروشندگان مختلف را مقایسه کنید تا مطمئن شوید که بهترین معامله را دریافت میکنید. و از آن نترسید چند ابری رفتن اگر دادهها را در یک ابر ذخیره میکنید، اما میتوانید سرویس تجزیه و تحلیل داده بهتری را از یک ابر دیگر دریافت کنید. (با این حال، به یاد داشته باشید که برای انتقال داده ها بین ابرها هزینه خروج پرداخت می کنید.)
نتیجه
همه می خواهند هزینه کار با داده ها را به حداقل برسانند. اما پیچیدگی ابزارهای ابری و مدلهای صورتحساب – و بسیاری از خدمات مختلف موجود برای کار با دادهها در فضای ابری – در بسیاری از موارد مشخص میکند که کدام معماری داده مبتنی بر ابر بهترین عملکرد را با کمترین هزینه داشته باشد. با این حال، با ارزیابی دقیق عواملی مانند هزینههای پردازش داده که به راحتی نادیده گرفته میشوند، و با اتخاذ یک رویکرد سیستماتیک و خودکار برای مدیریت دادههای ابری، میتوانید معماری دادههای خود را تا حد امکان مقرون به صرفه کنید.