با رایانش تطبیقی ​​برای جهانی هوشمندتر آماده شوید

گرگ مارتین مدیر بازاریابی استراتژیک Xilinx است

در بازارهای پویا و در حال تحولمانند 5G، مرکز داده، خودرو و صنعتیبرنامه‌های کاربردی شتاب محاسباتی فزاینده‌ای را می‌طلبند، در حالی که در بسته‌های قدرت فشرده باقی می‌مانند. یک عامل اصلی در تقاضا برای تراکم محاسباتی بالاتر، هوش مصنوعی (AI) است که پذیرش آن به سرعت در حال افزایش است.

استنتاج هوش مصنوعی به عملکرد پردازشی بالا با بودجه های کم توان نیاز دارد، خواه در ابر، لبه یا نقطه پایانی مستقر شود. سخت افزار اختصاصی هوش مصنوعی اغلب برای تسریع بارهای کاری استنتاج هوش مصنوعی مورد نیاز است.

در عین حال، الگوریتم‌های هوش مصنوعی بسیار سریع‌تر از سرعت چرخه‌های توسعه سنتی سیلیکون در حال تکامل هستند. تراشه‌های سیلیکونی ثابت، مانند پیاده‌سازی‌های ASIC شبکه‌های هوش مصنوعی، به دلیل نوآوری سریع در مدل‌های هوش مصنوعی پیشرفته، به سرعت منسوخ می‌شوند.

رایانش تطبیقی ​​پاسخی به این چالش هاست.

محاسبات تطبیقی ​​منحصر به فرد است زیرا شامل سخت افزار سیلیکونی است که می تواند برای برنامه های خاص بهینه شود بعد از ساخت. از آنجایی که بهینه سازی پس از تولید سخت افزار انجام می شود، می توان آن را با آخرین مدل های هوش مصنوعی پیکربندی کرد، مدل هایی که در زمان طراحی ASIC های رقیب وجود نداشتند. این بهینه سازی همچنین می تواند تقریباً بی نهایت بار انجام شده و مجدداً انجام شود و انعطاف پذیری منحصر به فردی را ارائه دهد. تغییرات سخت افزاری را می توان حتی پس از استقرار کامل دستگاه در یک محیط تولیدی نیز انجام داد. درست مانند یک CPU تولیدی که می‌توان برنامه جدیدی برای اجرا در اختیار داشت، به یک پلتفرم تطبیقی ​​نیز می‌توان پیکربندی سخت‌افزاری جدیدی برای انطباق با آن، حتی در یک محیط تولید زنده، داد.

سخت افزار تطبیقی ​​در مقابل جایگزین ها

پردازنده‌ها و پردازنده‌های گرافیکی دارای قابلیت‌های منحصربه‌فردی هستند و به خوبی برای انجام وظایف خاص مناسب هستند. CPU ها برای توابع تصمیم گیری که در آن منطق پیچیده نیاز به ارزیابی دارد، بهینه هستند. پردازنده‌های گرافیکی برای پردازش داده‌های آفلاین که به توان عملیاتی بالا نیاز است، بهینه هستند، اما تأخیر نگران کننده نیست. محاسبات تطبیقی ​​در جایی که توان عملیاتی بالا در زمان تأخیر کم مورد نیاز است، بهینه است، مانند پخش جریانی ویدیو در زمان واقعی، ارتباطات 5G و ترکیب حسگر خودرو.

دلیل اینکه محاسبات تطبیقی ​​می‌تواند عملکرد بالایی در زمان تأخیر کم ارائه دهد، توانایی فعال کردن معماری‌های دامنه خاص (DSAs) است که به طور بهینه برنامه‌های خاص را در دامنه‌های خاص پیاده‌سازی می‌کنند. در مقابل، CPU ها و GPU ها دارای معماری های ثابت و مبتنی بر فون نویمان هستند که اجازه بهینه سازی دامنه معماری زیربنایی خود را نمی دهند.

DSA ها همچنین می توانند با استفاده از یک دستگاه سیلیکونی اختصاصی (ثابت) ساخته شوند که معمولاً محصول استاندارد ویژه برنامه یا ASSP نامیده می شود. در حالی که اجرای DSA در یک ASSP ثابت مزایایی دارد، معایبی نیز دارد.

اول سرعت نوآوری است. برای ادامه، از تولیدکنندگان انتظار می رود که خدمات جدیدی را در بازه های زمانی کوتاه تر از همیشه ایجاد و ارائه کنند. به طور خاص، بازه‌های زمانی کوتاه‌تر از زمانی است که برای طراحی و ساخت یک DSA سیلیکونی ثابت جدید نیاز است. این یک ناهماهنگی اساسی بازار بین تقاضاهای بازار در مورد نوآوری و زمان لازم برای طراحی و ساخت ASSP توسط شرکت ها ایجاد می کند. تغییر در استانداردهای صنعتی یا سایر الزامات نوسانی می تواند به سرعت این دستگاه ها را منسوخ کند.

دومین مورد، هزینه سیلیکون سفارشی است. هزینه یکباره طراحی و ساخت یک طرح سیلیکونی منحصر به فرد، مانند یک ASIC پیچیده 7 نانومتری، می تواند چندین صد میلیون دلار هزینه مهندسی غیر تکراری (NRE) داشته باشد. پیش بینی می شود که با کاهش هندسه دستگاه به 5 نانومتر و کمتر، هزینه ها بیشتر افزایش یابد. افزایش هزینه، پذیرش گره های پیشرفته برای ASSP ها را کند می کند، که می تواند کاربران خود را با فناوری قدیمی و کم کارآمدتر مواجه کند.

معرفی پلتفرم های تطبیقی

پلتفرم‌های تطبیقی ​​همگی بر اساس یک پایه سخت‌افزار تطبیقی ​​اساسی هستند. با این حال، آنها بسیار بیشتر از سخت افزار یا دستگاه سیلیکونی هستند. پلتفرم های تطبیقی ​​مجموعه ای جامع از نرم افزارهای زمان اجرا را در بر می گیرند. در ترکیب، سخت‌افزار و نرم‌افزار قابلیت منحصربه‌فردی را ارائه می‌کنند که از آن می‌توان برنامه‌های بسیار انعطاف‌پذیر و در عین حال کارآمد ساخت.

این دستگاه ها محاسبات تطبیقی ​​را برای طیف وسیعی از توسعه دهندگان نرم افزار و سیستم در دسترس قرار می دهند. این پلتفرم‌ها می‌توانند به‌عنوان پایه‌ای برای بسیاری از محصولات، با مزایایی از جمله:

  1. کاهش زمان ورود به بازار برنامه‌ای که با استفاده از پلتفرمی مانند کارت شتاب‌دهنده مرکز داده Alveo ساخته می‌شود، می‌تواند از سخت‌افزار تسریع‌شده برای یک برنامه خاص استفاده کند، اما نیازی به سفارشی‌سازی سخت‌افزاری ندارد. یک کارت PCIe به سرور اضافه می شود و کتابخانه های تسریع شده مستقیماً از یک برنامه نرم افزاری موجود فراخوانی می شوند.

  2. کاهش هزینه های عملیاتی برنامه‌های بهینه‌شده مبتنی بر یک پلت‌فرم تطبیقی ​​می‌توانند به‌دلیل افزایش چگالی محاسباتی، راندمان قابل‌توجهی بالاتری را در هر گره نسبت به راه‌حل‌های فقط CPU ارائه دهند.

  3. بار کاری انعطاف پذیر و پویا پلتفرم های تطبیقی ​​را می توان بسته به نیازهای فعلی پیکربندی مجدد کرد. توسعه دهندگان می توانند به راحتی برنامه های مستقر شده در یک پلت فرم تطبیقی ​​را با استفاده از تجهیزات مشابه برای برآورده کردن نیازهای در حال تغییر حجم کاری تغییر دهند.

  4. طرح های اثبات شده در آینده پلتفرم‌های تطبیقی ​​را می‌توان به‌طور مداوم تطبیق داد. اگر ویژگی‌های جدیدی در یک برنامه موجود مورد نیاز باشد، سخت‌افزار را می‌توان برای اجرای بهینه این ویژگی‌ها برنامه‌ریزی کرد و نیاز به ارتقای سخت‌افزار را کاهش داد و در نتیجه طول عمر سیستم را افزایش داد.

  5. شتاب کل برنامه به ندرت استنتاج هوش مصنوعی به صورت مجزا وجود دارد. این بخشی از یک زنجیره بزرگتر از تجزیه و تحلیل و پردازش داده ها است که اغلب دارای چندین مرحله قبل و بعد است که از یک پیاده سازی سنتی (غیر هوش مصنوعی) استفاده می کند. بخش‌های تعبیه‌شده هوش مصنوعی این سیستم‌ها از شتاب هوش مصنوعی بهره می‌برند. قطعات غیر هوش مصنوعی نیز از شتاب بهره می برند. ماهیت انعطاف پذیر محاسبات تطبیقی ​​برای سرعت بخشیدن به وظایف پردازش هوش مصنوعی و غیر AI مناسب است. این “شتاب کل برنامه” نامیده می شود و از آنجایی که استنتاج هوش مصنوعی محاسباتی در برنامه های بیشتری نفوذ می کند، اهمیت فزاینده ای پیدا کرده است.

دسترسی به پلت فرم تطبیقی

در گذشته، بهره مندی از فناوری FPGA، توسعه دهندگان را ملزم می کرد که بردهای سخت افزاری خود را بسازند و از زبان توصیف سخت افزار (HDL) برای پیکربندی FPGA استفاده کنند. در مقابل، پلتفرم‌های تطبیقی ​​به توسعه‌دهندگان اجازه می‌دهند تا از محاسبات تطبیقی ​​مستقیماً از چارچوب‌ها و زبان‌های نرم‌افزار آشنا خود مانند C++، Python، TensorFlow و غیره بهره ببرند. توسعه‌دهندگان نرم‌افزار و هوش مصنوعی اکنون می‌توانند از محاسبات تطبیقی ​​بدون نیاز به ساخت برد یا متخصص سخت‌افزار استفاده کنند.

انواع مختلف پلتفرم های تطبیقی

انواع مختلفی از پلتفرم های تطبیقی ​​بر اساس کاربرد و نیاز وجود دارد، از جمله کارت های شتاب مرکز داده و ماژول های لبه استاندارد. پلتفرم های متعددی برای ارائه بهترین نقطه شروع ممکن برای برنامه مورد نظر وجود دارد. برنامه‌های کاربردی بسیار متفاوت هستند، از برنامه‌های حساس به تأخیر، مانند رانندگی مستقل و پخش ویدیو در زمان واقعی، تا پیچیدگی بالای پردازش سیگنال 5G و پردازش داده‌های پایگاه‌های داده بدون ساختار.

محاسبات تطبیقی ​​را می توان در ابر، شبکه، لبه و حتی در نقطه پایانی مستقر کرد و آخرین نوآوری های معماری را به برنامه های گسسته و انتها به انتها رساند. گستره مکان‌های استقرار به لطف انواع پلتفرم‌های تطبیقی ​​امکان‌پذیر است – از دستگاه‌های با ظرفیت بالا روی کارت‌های شتاب‌دهنده PCIe در مرکز داده، تا دستگاه‌های کوچک و کم مصرف مناسب برای پردازش نقطه پایانی مورد نیاز دستگاه‌های IoT.

معرفی موتور هوش مصنوعی

یکی از بزرگترین نوآوری های اخیر در محاسبات تطبیقی، معرفی موتور هوش مصنوعی توسط Xilinx بود. موتور هوش مصنوعی هنوز اساساً یک بلوک قابل تنظیم است، اما مانند یک CPU نیز قابل برنامه ریزی است. یک موتور هوش مصنوعی به جای اینکه از سخت افزار پردازش استاندارد FPGA تشکیل شود، دارای پردازنده های برداری اسکالر با کارایی بالا و داده های چندگانه (SIMD) است. این پردازنده‌ها برای پیاده‌سازی کارآمد توابع غنی از ریاضی که معمولاً در استنتاج هوش مصنوعی و ارتباطات بی‌سیم یافت می‌شوند، بهینه شده‌اند.

آرایه‌هایی از موتورهای هوش مصنوعی همچنان با اتصالات داده‌ای سازگار با FPGA مانند متصل هستند که امکان ساخت مسیرهای داده کارآمد و بهینه‌شده را برای برنامه مورد نظر فراهم می‌کند. این ترکیب از عناصر پردازشی شبیه به CPU که از نظر محاسباتی متراکم (غنی از ریاضیات) متصل به اتصال FPGA مانند هستند، نسل جدیدی از هوش مصنوعی و محصولات ارتباطی را آغاز می کند.

برای دنیایی هوشمندتر و متصل تر آماده شوید

اساساً، محاسبات تطبیقی ​​مبتنی بر فناوری FPGA موجود است، اما آن را برای طیف گسترده‌تری از توسعه‌دهندگان و برنامه‌های کاربردی بیش از همیشه در دسترس قرار می‌دهد. توسعه دهندگان نرم افزار و هوش مصنوعی اکنون می توانند برنامه های کاربردی بهینه سازی شده را با استفاده از محاسبات تطبیقی ​​بسازند، فناوری که قبلاً در دسترس آنها نبود.

توانایی تطبیق سخت افزار با یک برنامه خاص، تمایز منحصر به فردی از CPU ها، GPU ها و ASSP ها است که دارای معماری سخت افزاری ثابت هستند. محاسبات تطبیقی ​​به سخت افزار اجازه می دهد تا برای یک برنامه کاربردی طراحی شود و کارایی بالایی را به همراه داشته باشد، اما همچنان در صورت تغییر حجم کاری یا استانداردها، سازگاری آینده را امکان پذیر می کند.

همانطور که جهان بیشتر متصل و هوشمند می شود، محاسبات تطبیقی ​​همچنان در خط مقدم برنامه های بهینه و شتاب یافته قرار می گیرد و به همه توسعه دهندگان قدرت می دهد تا فردای بهتر بسازند.