مدل‌های باز هوش مصنوعی که LLM‌ها را به Data Commons Google متصل می‌کند

مدل‌های زبان بزرگ (LLM) که نوآوری‌های هوش مصنوعی امروزی را تقویت می‌کنند، به طور فزاینده‌ای پیچیده می‌شوند. این مدل‌ها می‌توانند حجم زیادی از متن را بررسی کنند و خلاصه‌سازی کنند، مسیرهای خلاقانه جدید و حتی پیش‌نویس کد را پیشنهاد دهند. با این حال، به همان اندازه که این قابلیت ها چشمگیر هستند، LLM ها گاهی اوقات با اطمینان اطلاعاتی را ارائه می دهند که دقیق نیستند. این پدیده که به عنوان “توهم” شناخته می شود، یک چالش کلیدی در هوش مصنوعی مولد است.

امروز ما پیشرفت‌های پژوهشی امیدوارکننده‌ای را به اشتراک می‌گذاریم که مستقیماً با این چالش مقابله می‌کند و با تثبیت LLMها در اطلاعات آماری دنیای واقعی به کاهش توهم کمک می‌کند. در کنار این پیشرفت‌های تحقیقاتی، ما بسیار هیجان‌زده هستیم که DataGemma را معرفی کنیم، اولین مدل‌های باز که برای اتصال LLM‌ها با داده‌های دنیای واقعی گسترده‌ای که از Data Commons Google طراحی شده‌اند، طراحی شده‌اند.

Data Commons: مخزن وسیعی از داده های قابل اعتماد و در دسترس عموم

Data Commons یک نمودار دانش در دسترس عموم است که حاوی بیش از 240 میلیارد نقطه داده غنی از صدها هزار متغیر آماری است. این اطلاعات عمومی را از سازمان‌های مورد اعتماد مانند سازمان ملل متحد (UN)، سازمان بهداشت جهانی (WHO)، مراکز کنترل و پیشگیری از بیماری‌ها (CDC) و دفاتر سرشماری منبع می‌گیرد. ترکیب این مجموعه داده‌ها در یک مجموعه یکپارچه از ابزارها و مدل‌های هوش مصنوعی به سیاست‌گذاران، محققان و سازمان‌هایی که به دنبال بینش دقیق هستند، قدرت می‌دهد.

Data Commons را به عنوان یک پایگاه داده گسترده و دائماً در حال گسترش پر از اطلاعات عمومی قابل اعتماد در مورد طیف گسترده ای از موضوعات، از سلامت و اقتصاد گرفته تا جمعیت شناسی و محیط زیست در نظر بگیرید، که می توانید با استفاده از زبان طبیعی مبتنی بر هوش مصنوعی ما با آن تعامل داشته باشید. رابط کاربری به عنوان مثال، می‌توانید کشف کنید که کدام کشورهای آفریقا بیشترین افزایش دسترسی به برق را داشته‌اند، چگونه درآمد با دیابت در کشورهای ایالات متحده مرتبط است یا جستجوی اطلاعات کنجکاو شما.

چگونه Data Commons می تواند به مقابله با توهم کمک کند

همانطور که استفاده از هوش مصنوعی مولد در حال افزایش است، ما قصد داریم این تجربیات را با ادغام Data Commons در Gemma، خانواده مدل‌های باز سبک وزن و پیشرفته ما که از همان تحقیقات و فناوری استفاده شده برای ایجاد مدل‌های Gemini ساخته شده‌اند، مستقر کنیم. این مدل های DataGemma از هم اکنون در دسترس محققان و توسعه دهندگان است.

DataGemma با استفاده از دانش Data Commons برای افزایش واقعیت و استدلال LLM با استفاده از دو رویکرد مجزا، قابلیت‌های مدل‌های Gemma را گسترش می‌دهد:

1. RIG (نسل بازیابی-درهم) قابلیت‌های مدل زبان ما، Gemma 2، را با جستجوی فعال منابع قابل اعتماد و بررسی واقعیت در برابر اطلاعات در Data Commons افزایش می‌دهد. هنگامی که از DataGemma خواسته می شود تا یک پاسخ ایجاد کند، مدل برای شناسایی نمونه هایی از داده های آماری و بازیابی پاسخ از Data Commons برنامه ریزی می شود. در حالی که روش RIG جدید نیست، کاربرد خاص آن در چارچوب DataGemma منحصر به فرد است.

Source link