سیستم های RAG سنتی با نمایه سازی داده های خام کار می کنند. این داده ها به سادگی تکه تکه شده و در DB های برداری ذخیره می شوند. هر زمان که درخواستی از کاربر می آید، تکه های ذخیره شده و بازیابی می کند تکه های مربوطه اگر می خواهید اصول RAG را یاد بگیرید، مقدمه ای جامع در مورد آن نوشته ام
از آنجایی که مرحله بازیابی برای هر پرس و جو از کاربر اتفاق می افتد، این مهم ترین گلوگاه برای سرعت بخشیدن به سیستم های ساده RAG است. آیا منطقی نیست که فرآیند بازیابی فوق العاده کارآمد باشد؟ این وعده است LightRAG.
چرا GraphRAG نه؟
قبل از اینکه به آنها نگاه کنیم، ممکن است بپرسید: «صبر کنید. آیا ما GraphRAG از مایکروسافت نداریم؟». بله، اما به نظر می رسد GraphRAG چند اشکال دارد.
- به روز رسانی افزایشی دانش (بخش 3.1) GraphRAG ابتدا یک مرجع به موجودیت ها و روابط در کل مجموعه داده خصوصی ایجاد می کند. سپس خوشه بندی از پایین به بالا انجام می دهد که داده ها را به صورت سلسله مراتبی در خوشه های معنایی سازماندهی می کند. به روز رسانی مجموعه داده با دانش جدید به این معنی است که ما باید کل فرآیند ساخت نمودار را طی کنیم! از سوی دیگر، LightRAG به سادگی با افزودن دانش جدید به دانش موجود، به این موضوع میپردازد. به طور خاص، گرهها و لبههای گراف جدید را از طریق یک عملیات اتحاد ساده با گرههای موجود ترکیب میکند.
- شدت محاسباتی همانطور که…