چگونه گوگل ابزارهای هوش مصنوعی مولد را برای مرورگر کروم ساخت

از منظر مهندسی، پیاده سازی فناوری LLM در کروم یک چالش بود. آدریانا می گوید: «این یک مجموعه مهارت جدید است». ما نه تنها باید یاد می‌گرفتیم که این فناوری چگونه کار می‌کند، بلکه چگونه آن را به محصولی تبدیل کنیم که مردم می‌توانند از آن استفاده کنند. ویژگی های مرسوم مرورگر هر بار که آنها را اجرا می کنید یکسان عمل می کنند. اگر یک ویژگی ورودی یکسانی داشته باشد، همان خروجی را می دهد.” وقتی آدریانا و تیمش برای یک ویژگی جدید کروم کد می نویسند، آزمایش هایی را نیز می نویسند تا بررسی کنند که همانطور که انتظار می رود کار می کند. “اگر تست ها را با موفقیت پشت سر بگذارد، اطمینان دارید. کار می کند،” او می گوید.

با ویژگی هایی که از هوش مصنوعی مولد استفاده می کنند، کار چندان ساده ای نیست. مدل‌های زبان بزرگ، متن یا تصاویر را تشخیص داده و تولید می‌کنند، و باید بتوانند با انواع ورودی‌های کاربر سازگار شوند. آدریانا می‌گوید: «ما مدل پایه را انتخاب می‌کنیم و به آن آموزش می‌دهیم که چه کاری را می‌خواهیم برای موارد استفاده مثالمان انجام دهد، و سپس نحوه عملکرد آن را در برابر انواع مختلف سناریوهای کاربر ارزیابی می‌کنیم. تعیین اینکه آیا کار می کند یا خیر، نیاز به ارزیابی عمیق انسانی دارد. آدریانا می‌گوید: «این یک باینری ساده از «اجرا می‌شود» یا «اجرا نمی‌شود» نیست. “ما به آن نگاه می کنیم و فکر می کنیم، “آیا لحن درست است؟ آیا این طول خوب است؟ آیا این همان سطح خاصی است که ما به دنبال آن هستیم؟” این یک روند بسیار متفاوت است.”

یکی از سناریوهای آموزشی که آدریانا فکر می کرد بسیار جالب بود این بود که چگونه سازمان دهنده تب هوش مصنوعی از ایموجی ها استفاده می کند. او می‌گوید: «من واقعاً دوست دارم که مردم چگونه از شکلک‌ها برای برچسب زدن گروه‌های برگه استفاده می‌کنند». وقتی در حال اسکن برگه‌های خود هستید، دیدن شکلک، دانستن موضوع آن گروه برگه را آسان‌تر می‌کند. تیم Chrome می‌خواست سازمان‌دهنده برگه خودکار جدید یک گزینه شکلک برای کاربران داشته باشد، اما آنها نیز این کار را نکردند. نمی‌خواهید گزینه‌های نامناسب را انتخاب کند. به عنوان مثال، آدریانا توضیح می‌دهد که اگر در حال برنامه‌ریزی یک جشن زندگی هستید، آن‌ها نمی‌خواهند کروم جمجمه و استخوان‌های متقاطع را به شما نشان دهد. بنابراین، با کمک تیم ایموجی گوگل، آنها تصمیم گرفتند تا مشخص کنند که چه دسته بندی هایی برای استفاده گسترده ایمن هستند. او می‌گوید: «سفر، حیوانات، مکان‌ها، طبیعت» این نوع چیزها موارد استفاده عالی برای شکلک‌ها هستند، بنابراین می‌دانیم که سازمان‌دهنده تب خودکار شانس خوبی برای درست کردن آن تنها با ترسیم از آن دسته‌ها دارد. .

تیم کروم همچنین می‌خواست مطمئن شود که مردم می‌توانند از ویژگی‌های جدید هوش مصنوعی بدون نیاز به درک نحوه عملکرد فناوری زیربنایی استفاده کنند. بنابراین آنها به من کمک کن تا بنویسم تا متن را از صفحه وبی که در آن هستی جمع‌آوری کنم و از آنجا بگیرم. آدریانا می‌گوید: «این می‌تواند ببیند که می‌خواهید یک نقد رستوران بنویسید و آن را تنظیم کنید، در مقابل کمک به پر کردن فرم یا فروش چیزی». به طور مشابه، هنگام ایجاد ابزار تم های هوش مصنوعی، در ابتدا فکر می کردند که کاربران می توانند درخواست های خود را برای پر کردن تم های بصری بنویسند. آدریانا می‌گوید: «ما متوجه شدیم که ارائه یک درخواست برای این کار واقعاً دشوار است. در عوض، آنها با یک رویکرد کشویی پیش رفتند که در آن سوژه‌ای را انتخاب می‌کنید – مانند شفق قطبی یا رنگین کمان – و سپس می‌توانید از سایر کشویی‌ها برای اضافه کردن جزئیات استایل و انتخاب یک طرح رنگ استفاده کنید. آدریانا می‌گوید: «ما از مردم می‌خواهیم که بتوانند آن را سفارشی کنند، اما گزینه‌های محدودتری نیز ارائه دهند که نتایج خوبی به همراه داشته باشد».