هنگام پیاده سازی چت بات خود یک مشکل وجود دارد و آن مدیریت حافظه در حین مکالمه است. البته، میتوانید از کتابخانههای آمادهای مانند «Langchain»، «Ollama» و غیره استفاده کنید… اما اگر بخواهید الگوریتم خود را از ابتدا پیادهسازی کنید، چه؟
ما در اینجا رویکردی برای مدیریت حافظه کوتاه مدت در چت بات ها، با استفاده از ترکیبی از تکنیک های ذخیره سازی و خلاصه سازی خودکار برای بهینه سازی زمینه مکالمه ارائه می دهیم. روش معرفی شده متکی بر ساختار حافظه پویا است که اندازه داده ها را محدود می کند و در عین حال اطلاعات ضروری را از طریق خلاصه های هوشمند حفظ می کند.
این رویکرد نه تنها سیال بودن تعاملات را بهبود می بخشد، بلکه تداوم متنی را در طول جلسات گفتگوی طولانی تضمین می کند. علاوه بر این، استفاده از تکنیکهای ناهمزمان تضمین میکند که عملیات مدیریت حافظه در پاسخگویی ربات چت تداخلی ایجاد نمیکند.
در این بخش مدیریت حافظه مکالمه در ربات چت را به صورت ریاضی رسمی می کنیم. ساختار حافظه به صورت فهرستی از جفتها است که مبادلات بین کاربر و ربات را نشان میدهد.
نگران نباشید، این بخش بسیار ساده است، فقط به ما اجازه می دهد مکانیسم های اساسی را مدل سازی کنیم تا بتوانیم آنها را به کد منتقل کنیم.
ساختار حافظه مکالمه
حافظه مکالمه را می توان به عنوان یک لیست مرتب شده از جفت ها تعریف کرد (u_i،…