مدل های بزرگ زبان امروزی به حجم روزافزونی از اطلاعات دسترسی دارند. با این حال، گنجینه گسترده ای از داده های خصوصی وجود دارد که این مدل ها از آنها استفاده نمی کنند. به همین دلیل است که یکی از محبوبترین برنامههای LLM در تنظیمات سازمانی، تولید تقویتشده بازیابی – به اختصار RAG است. در
شما یاد خواهید گرفت که چگونه از LangChain، چارچوب بسیار محبوب برای ساخت سیستم های RAG، برای ساخت یک سیستم RAG ساده استفاده کنید. در پایان آموزش، ما یک ربات چت (با رابط Streamlit و همه) خواهیم داشت که راه خود را از طریق برخی از داده های خصوصی برای پاسخ به سؤالات RAG می کند.
RAG چیست؟
برای روشن شدن اینکه RAG چیست، بیایید یک مثال ساده را در نظر بگیریم.
چندلر، یک دانشجوی سال اول کالج، در نظر دارد چند کلاس را رد کند، اما میخواهد مطمئن شود که سیاست حضور در دانشگاه را نقض نمیکند. مانند هر چیز این روزها، او این سوال را از ChatGPT می پرسد.
البته ChatGPT نمی تواند به آن پاسخ دهد. چت بات احمقانه نیست – فقط به اسناد دانشگاه چندلر دسترسی ندارد. بنابراین، چندلر خودش سند خط مشی را پیدا می کند و…