رشد انفجاری هوش مصنوعی نیاز به رویکردهای جدید برای استفاده از انرژی، مدیریت داده ها و تجمیع اطلاعات را ایجاد کرده است. آرشیو فعال میتواند به حل بسیاری از این چالشها کمک کند و سازمانها را قادر میسازد تا از تمام قدرت مجموعه دادههای بزرگ هوش مصنوعی بهرهبرداری کنند.
هوش مصنوعی برنامه ها با دسترسی به حداکثر داده های ممکن رشد می کنند. با این حال، راه حل های امروزی برای مدیریت و ذخیره سازی داده ها منجر به غرق شدن مراکز داده با شبکه های گران قیمت و پر انرژی با کارایی بالا و سخت افزار ذخیره سازی شده است.
همانطور که استقرار هوش مصنوعی ادامه دارد، واضح است که این فناوری بازی را تغییر می دهد به مصرف مقادیر زیادی انرژی ادامه خواهد داد. یک پرس و جو در یک مدل زبان بزرگ (LLM) مانند ChatGPT صد برابر بیشتر از جستجوی گوگل کربن تولید می کند.
علاوه بر این، LLM ها نیاز به آموزش دارند، که می تواند تا 10 گیگاوات ساعت برای یک مدل واحد مصرف کند. فقط گوگل، آژور و AWS نیستند که LLM ها را ایجاد می کنند. بسیاری از شرکت ها، دولت ها و سازمان ها بر روی مدل های خود کار می کنند.
اغلب به اندازه کافی، بیشتر این داده ها ممکن است پس از چند هفته اول به طور مکرر در دسترس نباشند. با این حال، برخی از داده های تاریخی باید آسان تر و راحت تر در دسترس باشند. منطقی است که چندین لایه ذخیره سازی را بر اساس فرکانس دسترسی، تأخیر و هزینه ترتیب دهیم، نه اینکه همه آن را در ذخیره سازی اولیه گران قیمت و پر انرژی نگه داریم. چنین معماری هایی باید از مسائل مربوط به مدیریت داده پشتیبانی کنند که به طور طبیعی در مواقعی که سطوح خدمات متنوعی مورد نیاز است ظاهر می شوند.
هر مجموعه داده هوش مصنوعی به ذخیره سازی با عملکرد بالا نیاز ندارد
نرمافزار مدیریت داده هوشمند بایگانی فعال اجازه میدهد دادهها در مکانهای متعدد ذخیره شوند و در دستگاههای ذخیرهسازی و سطوح مختلف پخش شوند، در حالی که هر زمان که برای پشتیبانی از نیازهای کاربر، از جمله گردشهای کاری هوش مصنوعی، به آن دادهها نیاز باشد، به آسانی قابل دسترسی است.
تعداد کمی از مجموعه دادههای هوش مصنوعی وجود دارند که ممکن است «سرد» در نظر گرفته شوند، زیرا در مقایسه با مجموعههای داده فعالی که بهطور منظم بهعنوان بخشی از جریانهای کاری هوش مصنوعی در حال انجام استفاده و بهروزرسانی میشوند، به ندرت مورد دسترسی یا استفاده قرار میگیرند. در میان این مجموعه دادههای سرد ممکن است دادههای تاریخی وجود داشته باشند که دیگر مورد استفاده قرار نمیگیرند یا آموزش نمیبینند. داده های انطباق طولانی مدت برای برآوردن الزامات قانونی یا قانونی؛ داده های مورد استفاده برای اهداف آزمایشی یا آموزش مقدماتی؛ داده های استفاده نشده یا رد شده؛ و داده های مصنوعی که برای آزمایش، معیار یا تحقیق خارج از گردش کار تولید هوش مصنوعی استفاده می شود.
مدیریت کارآمد داده های سرد در یک آرشیو فعال برای بهینه سازی ضروری است ذخیره سازی و منابع انرژی برای اطمینان از اینکه حتی داده ها با ارزش صرفاً بالقوه آینده می توانند به طور مقرون به صرفه برای دوره های زمانی نامحدود نگهداری شوند.
تاثیر هوش مصنوعی بر آرشیوها
بایگانیها زمانی به عنوان مخازن دادهها در نظر گرفته میشدند که فقط گهگاهی به آنها دسترسی پیدا میکردند. ظهور هوش مصنوعی مدرن معادله را تغییر داده است. تقریباً تمام دادههای سازمانی اگر در اختیار یک موتور هوش مصنوعی قرار گیرند، میتوانند ارزشمند باشند. بنابراین، بسیاری از شرکتها برای جمعآوری دادههای سازمانی در یک مکان و در دسترس قرار دادن آنها برای دسترسی به ابزارهای هوش مصنوعی و GenAI به آرشیو روی میآورند.
بایگانیهای عظیم دادهها را میتوان در یک بایگانی فعال با قیمت مقرون به صرفه و در سطوح مصرف انرژی بسیار پایین ذخیره کرد، در حالی که این دادهها به راحتی در شبکه در دسترس هستند. سپس دهها داده بایگانی شده را میتوان به عنوان بخشی از یک الگوریتم LLM یا دیگر یادگیری ماشینی یا یادگیری عمیق تجزیه و تحلیل کرد.
نرم افزار مدیریت هوشمند داده ها
یک لایه نرم افزار مدیریت داده هوشمند پایه و اساس یک آرشیو فعال است. این لایه نرمافزاری نقشی حیاتی در انتقال خودکار دادهها بر اساس سیاستهای تعریفشده توسط کاربر به جایی که برای هزینه، عملکرد و اولویتهای حجم کاری تعلق دارد، ایفا میکند.
داده های با ارزشی که اغلب به آنها دسترسی پیدا می کنند را می توان در حافظه حفظ کرد. سایر دادهها میتوانند روی SSDها، سطوح پایینتر دیسکها و در یک بایگانی فعال مبتنی بر نوار یا ابر قرار داشته باشند. این به برنامههای هوش مصنوعی اجازه میدهد تا همه آن دادهها را بدون تأخیر به دلیل ذخیره محتوای خارج از سایت یا انتقال به جایی که هوش مصنوعی میتواند آن را پردازش کند، استخراج کند.
حفظ پایداری ذخیره سازی
در نتیجه رونق هوش مصنوعی، مراکز داده بزرگتر، متراکمتر و انرژیبرتر میشوند. در واقع، صنعت در حال حاضر تقریبا برای 2 درصد کل مصرف برق در ایالات متحده این روند احتمالاً ادامه می یابد زیرا واحدهای پردازش گرافیکی (GPU) بیشتری برای پاسخگویی به نیازهای محاسبات با کارایی بالا (HPC)، GenAI و سایر برنامه های کاربردی مورد نیاز اضافه می شوند.
ذخیره سازی داده های سرد و به ندرت در یک آرشیو فعال به طور قابل توجهی بر مصرف برق و انتشار CO2e تأثیر می گذارد. به گفته مشاور براد جانزدر یک مطالعه که در آن 100 PB داده باید در طول ده سال نگهداری شود، 40٪ از این داده ها روی سیستم های HDD نگهداری می شود در حالی که 60٪ به یک سیستم کتابخانه نوار داده خودکار منتقل می شود، منجر به کاهش 58٪ در انتشار CO2e در حالی که زباله های الکترونیکی است. 53 درصد کاهش یافته است.
آخرین اخبار ذخیره سازی اطلاعات را بیشتر بخوانید
تقاضا برای ظرفیت ذخیره سازی سازمانی بدون شک در سال های آینده شتاب خواهد گرفت. رشد عظیم مبتنی بر هوش مصنوعی نیاز به مدیریت موثر داده از لبه تا مرکز داده اصلی و ابر را برجسته کرده است.
مدیریت کارآمد داده مقادیر عظیمی از داده ها در قلب موفقیت هوش مصنوعی است. اگر سازمانهایی که ابتکارات هوش مصنوعی را هدایت میکنند، به پتانسیل خود برای نتایج مولد و سودمند پی ببرند، باید قادر به پردازش، تجزیه و تحلیل، همبستگی و نتیجهگیری بر اساس حجم وسیعی از اطلاعات باشند. زمانی که حجم داده ها از چند PB فراتر رفت، یک آرشیو فعال می تواند ترکیب مناسبی از دسترسی، عملکرد، بهره وری انرژی و مقرون به صرفه بودن را به برنامه های هوش مصنوعی ارائه دهد.
زیرساخت برای هوش مصنوعی باید بر پایه ای از ذخیره سازی داده ها و گردش کار به خوبی برنامه ریزی شده باشد. در غیر این صورت، مدیریت داده با برنامه ریزی ضعیف بر هزینه ها، امنیت داده ها، انعطاف پذیری سایبری، انطباق قانونی، تجربیات مشتری، تصمیم گیری، مصرف انرژی و حتی شهرت برند تأثیر منفی می گذارد.
در این عصر هوش مصنوعی، مدیریت موثر داده بخشی ضروری از شایستگیهای اصلی است که سازمانها باید برای تحول دیجیتال مؤثر به آن دست یابند. و اینجاست که راه حل بایگانی فعال به نفع شرکت مدرن مبتنی بر هوش مصنوعی است.