در Data Center World 2023، Vlad Galabov از Omdia و Kumaran Siva از AMD در مورد پردازندهها و هوش مصنوعی، بهویژه نحوه تأثیر آنها بر عملکرد، هزینه، مصرف انرژی و پایداری بحث کردند.
این قسمت 2 گفتگوی آنها در DCW است. برای قسمت 1 اینجا را کلیک کنید.
رونوشت در زیر آمده است. ویرایش های جزئی برای وضوح انجام شده است.
رونوشت:
ولاد گالبوف: ما در مورد آخرین گره فرآیند صحبت می کنیم، یکی از موضوعات بسیار داغ. آنچه اغلب با گرههای فرآیند مرتبط است و با عملکرد محاسباتی مرتبط است، هوش مصنوعی است. آیا می توانید در مورد آنچه که مردم به عنوان مفیدترین ویژگی یک پردازنده می دانند صحبت کنید؟ اغلب ما در مورد ضرب ماتریس صحبت می کنیم و تمایل داریم که در مورد معیار در صنعت خود وسواس داشته باشیم. اما واقعیت این است که افراد معیارهایی را بر روی سرورهای خود اجرا نمی کنند – آنها از حجم کاری واقعی استفاده می کنند. بنابراین، چه جنبههایی از عملکرد برنامههای هوش مصنوعی تحت تأثیر چه جنبههایی از یک پردازنده دیدهاید؟
کوماران سیوا: بنابراین، اگر امروز به پردازندههای AMD نگاه کنید، آنها با مقیاسکنندههای فوقالعاده مستقر شدهاند که در حین صحبت ما هوش مصنوعی را روی آنها انجام میدهند. بنابراین، ما چند شرکت بزرگ داریم که در مورد استفاده از هوش مصنوعی خود صحبت کرده اند. به عنوان مثال، Tencent و WeChat در مورد نحوه استفاده از راه حل موتور توصیه صحبت کردند. و بسیاری، بسیاری دیگر از سیلیکون AMD برای آن استفاده می کنند.
جایی که ما می درخشیم این است که بهترین پردازنده همه منظوره را ارائه می دهیم. و شما به استنتاج نگاه می کنید و این یک سری مراحل خط لوله است. بنابراین، شما باید داده ها را دریافت کنید، باید داده ها را از قبل پردازش کنید، سپس باید استنتاج را انجام دهید، و سپس باید کاری را با نتیجه انجام دهید. و بنابراین، کل آن خط لوله خود را به داشتن یک هسته بسیار کارآمد که مقیاس میشود، میرساند. و این مزیتی است که بسیاری از مشتریان ما توانسته اند از آن استفاده کنند.
اگر فقط روی یک معیار یا ضرب ماتریس تمرکز کنید، بله، احتمالاً می توانید راه حل های کارآمدتری پیدا کنید. اما بعد از پایان به انتها، آنقدر رقیق می شود که اهمیتی ندارد. و این یکی از کلیدهای AI در هر دو CPUهای همه منظوره و به ویژه معماری AMD است.
ولاد: جالب اینجاست که من هفته گذشته با Tencent بودم و یکی از چیزهایی که آنها به دنبال آن بودند این بود که چگونه برای پایداری نوآوری کنیم – چگونه مصرف برق خود را برای همه بارهای کاری کاهش دهیم. من فکر میکنم آنچه شما نشان میدهید این است که با مواد تشکیل دهنده داخل رک، سرور و پردازندههایی که استفاده میکنید ارائه میشود. و از همه جالبتر، آنها همچنین به دنبال چگونگی کاهش مصرف انرژی زیرساخت فیزیکی در مرکز داده خود هستند. آزمایش اولیه آنها خنکسازی مایع است، و یک همافزایی بسیار خوب از نظر کارآمد بودن یا اجرای یکی از داغترین بارهای کاری در جهان وجود دارد.
بنابراین، من فکر می کنم که ما نمی توانیم در سال 2023 بنشینیم و در مورد محاسبات بدون صحبت در مورد فیل در اتاق صحبت کنیم. از سال گذشته که اولین نشست تحلیلی Omdia را برگزار کردیم، یکی از چیزهایی که جهان را غرق در طوفان کرد، هوش مصنوعی مولد است. ChatGPT به جریان اصلی تبدیل شده است. خیلی سریع پذیرفته شد و یکی از کارهایی که ما به عنوان تحلیلگر انجام داده ایم، تحقیق در مورد نحوه انجام آموزش در ChatGPT است. این کاملاً مستند شده است. از یک خوشه محاسباتی با کارایی بالا و معماری استفاده می کند که اکثر ما با آن آشنا هستیم.
اما با توجه به آنچه که ما بهعنوان تحلیلگر دیدهایم، چالش بزرگ این است که چگونه راهحلی مانند ChatGPT را به یک محصول تجاری قابل دوام تبدیل کنیم و بتوانیم آن را به صورت مقرونبهصرفه انجام دهیم – استنتاج را مقرونبهصرفه اجرا کنیم، استنتاج را در یک محصول اجرا کنیم. روشی که بتوانید پایدار باشید و از قدرت زیاد استفاده نکنید. آیا می توانید در مورد استنتاج هوش مصنوعی به عنوان یک حجم کاری صحبت کنید؟ به نظر شما چه الزاماتی دارد؟ چگونه می توانیم استنتاج هوش مصنوعی را به طور بهینه اجرا کنیم؟ زیرا من فکر نمیکنم این فقط در مورد محاسبات باشد. آن را نیز در مورد هزینه. این همچنین در مورد بهره وری انرژی و پایداری است.
کوماران: بله، قطعا. بنابراین، چند فکر وجود دارد. بدیهی است که AMD به عنوان یک ارائه دهنده نیمه هادی گسترده، ما پردازنده های گرافیکی خود را نیز داریم. بنابراین، ما درگیر روند هوش مصنوعی و هوش مصنوعی مولد هستیم. بنابراین، ما در اینجا در جنبه های مختلف درگیر هستیم. یکی از چیزهایی که از نقطه نظر CPU میتوانید دوباره به آن فکر کنید، تصویر انتها به انتها است، که در آن فقط پاسخی نیست که باید به آن برگردید، بلکه مقداری تجزیه و تحلیل، مقداری پیش پردازش وجود دارد. همه آنها و همچنین خود استنتاج واقعی جمع می شوند. و بنابراین، CPU ها ارزش پیشنهادی منحصر به فردی را ارائه می دهند.
در خود استنتاج واقعی، ما با افرادی که روی پراکندگی کار میکنند، همکاری کردهایم. برای مثال، یکی از شرکتها، Neural Magic، نتایج فوقالعادهای را در CPUهای جنوا نشان داده است – تا 1000 برابر بهتر از نوع کدهای معمولی، بهینهنشده و زمان اجرا Onyx. و این حتی درهایی را برای فکر کردن در مورد اینکه چگونه می توانید استنتاج هوش مصنوعی مولد، شاید در یک CPU، انجام دهید، باز می کند.
اما یک تصویر گسترده تر، ما شاهد تبدیل شدن هوش مصنوعی به بخشی از جعبه ابزاری هستیم که برنامه نویسان از آن استفاده می کنند. تیترها توسط ChatGPT گرفته می شود، اما واقعیت این است که حتی در برنامه نویسی روزمره، شما شروع به مشاهده مدل های کوچکتر و متوسط می کنید. و اینها به عنوان بخشی از جریان کد یکپارچه می شوند و سپس به طور طبیعی در برنامه ها قرار می گیرند.
من فکر میکنم این یکی از راههایی است که برای مثال، شرکتهایی که هوش مصنوعی را اتخاذ میکنند، خواهیم دید. در خود برنامههای ISV، مدلهای کوچکتر و متوسطی خواهند داشت که فقط برای کمک به تجزیه و تحلیل دادهها و ارائه مناسبتر تصاویر بصری دادهها استفاده میشوند. منظورم این است که در حال حاضر خواهید دید، حتی با مایکروسافت آفیس، آنها آن نوار کناری کوچکی دارند که تمام توصیه های مختلف را نشان می دهد یا اینکه می خواهید اسلاید شما چگونه به نظر برسد، و این احتمالاً یک مدل هوش مصنوعی کوچک است. بنابراین، شما چیزهایی مانند آن دارید که شروع به نفوذ به طراحی رابط کاربری و تجزیه و تحلیل داده ها می کنند. این نوع عناصر شروع به تکثیر خواهند کرد.
ولاد: اوه، قطعا. یکی از چیزهایی که با همکارانم که در بررسی نحوه برنامهنویسی یک کامپیوتر هوش مصنوعی تخصص دارند، بررسی کردیم این است که در واقعیت، یک سری هوش مصنوعی خستهکننده وجود دارد که ما درباره آن صحبت نمیکنیم و ارزش تجاری فوقالعادهای دارد. آنها چند مطالعه موردی انجام داده اند که نشان می دهد یک فروشگاه خرده فروشی چقدر توانسته است با استقرار چند مدل بسیار ساده هوش مصنوعی پس انداز کند. بنابراین، من فکر میکنم، بله، ما درباره سرفصلهای جالبترین چیز صحبت کردیم، اما در مدلهای بسیار ساده هوش مصنوعی که به راحتی میتوان آنها را حتی بر روی تلفن شما هم اجرا کرد، ارزش تجاری دستنخورده زیادی وجود دارد. بنابراین، مطمئناً در یک پردازنده بسیار کارآمد.
کوماران: بله، قطعا.
ولاد: خوب، ما بسیار مشتاقانه منتظر شنیدن اطلاعات بیشتر در مورد سفر پایداری AMD هستیم و اینکه چگونه می توان از نوآوری CPU برای تغییر نحوه انجام ساختار مرکز داده استفاده کرد. بنابراین، من مشتاقانه منتظر پیوستن شما به ما در نشست تحلیلی Omdia هستم و از شما برای زمانی که در اختیار ما گذاشتید سپاسگزارم.
کوماران: خیلی ممنون ولاد. لذت بخش بود.