مدلهای زبان بزرگ (LLM) که نوآوریهای هوش مصنوعی امروزی را تقویت میکنند، به طور فزایندهای پیچیده میشوند. این مدلها میتوانند حجم زیادی از متن را بررسی کنند و خلاصهسازی کنند، مسیرهای خلاقانه جدید و حتی پیشنویس کد را پیشنهاد دهند. با این حال، به همان اندازه که این قابلیت ها چشمگیر هستند، LLM ها گاهی اوقات با اطمینان اطلاعاتی را ارائه می دهند که دقیق نیستند. این پدیده که به عنوان “توهم” شناخته می شود، یک چالش کلیدی در هوش مصنوعی مولد است.
امروز ما پیشرفتهای پژوهشی امیدوارکنندهای را به اشتراک میگذاریم که مستقیماً با این چالش مقابله میکند و با تثبیت LLMها در اطلاعات آماری دنیای واقعی به کاهش توهم کمک میکند. در کنار این پیشرفتهای تحقیقاتی، ما بسیار هیجانزده هستیم که DataGemma را معرفی کنیم، اولین مدلهای باز که برای اتصال LLMها با دادههای دنیای واقعی گستردهای که از Data Commons Google طراحی شدهاند، طراحی شدهاند.
Data Commons: مخزن وسیعی از داده های قابل اعتماد و در دسترس عموم
Data Commons یک نمودار دانش در دسترس عموم است که حاوی بیش از 240 میلیارد نقطه داده غنی از صدها هزار متغیر آماری است. این اطلاعات عمومی را از سازمانهای مورد اعتماد مانند سازمان ملل متحد (UN)، سازمان بهداشت جهانی (WHO)، مراکز کنترل و پیشگیری از بیماریها (CDC) و دفاتر سرشماری منبع میگیرد. ترکیب این مجموعه دادهها در یک مجموعه یکپارچه از ابزارها و مدلهای هوش مصنوعی به سیاستگذاران، محققان و سازمانهایی که به دنبال بینش دقیق هستند، قدرت میدهد.
Data Commons را به عنوان یک پایگاه داده گسترده و دائماً در حال گسترش پر از اطلاعات عمومی قابل اعتماد در مورد طیف گسترده ای از موضوعات، از سلامت و اقتصاد گرفته تا جمعیت شناسی و محیط زیست در نظر بگیرید، که می توانید با استفاده از زبان طبیعی مبتنی بر هوش مصنوعی ما با آن تعامل داشته باشید. رابط کاربری به عنوان مثال، میتوانید کشف کنید که کدام کشورهای آفریقا بیشترین افزایش دسترسی به برق را داشتهاند، چگونه درآمد با دیابت در کشورهای ایالات متحده مرتبط است یا جستجوی اطلاعات کنجکاو شما.
چگونه Data Commons می تواند به مقابله با توهم کمک کند
همانطور که استفاده از هوش مصنوعی مولد در حال افزایش است، ما قصد داریم این تجربیات را با ادغام Data Commons در Gemma، خانواده مدلهای باز سبک وزن و پیشرفته ما که از همان تحقیقات و فناوری استفاده شده برای ایجاد مدلهای Gemini ساخته شدهاند، مستقر کنیم. این مدل های DataGemma از هم اکنون در دسترس محققان و توسعه دهندگان است.
DataGemma با استفاده از دانش Data Commons برای افزایش واقعیت و استدلال LLM با استفاده از دو رویکرد مجزا، قابلیتهای مدلهای Gemma را گسترش میدهد:
1. RIG (نسل بازیابی-درهم) قابلیتهای مدل زبان ما، Gemma 2، را با جستجوی فعال منابع قابل اعتماد و بررسی واقعیت در برابر اطلاعات در Data Commons افزایش میدهد. هنگامی که از DataGemma خواسته می شود تا یک پاسخ ایجاد کند، مدل برای شناسایی نمونه هایی از داده های آماری و بازیابی پاسخ از Data Commons برنامه ریزی می شود. در حالی که روش RIG جدید نیست، کاربرد خاص آن در چارچوب DataGemma منحصر به فرد است.