هر چند مدل زبان (LM) آموزش دیده، اطلاعات زیادی را میشناسد، اما هنوز اطلاعات خصوصی شرکت و اطلاعات جدید را نمیشناسد. بسیاری از برنامههای LM برای پرس و جو در دادههای خصوصی شرکت نیاز دارند، سپس دادههای خصوصی را به عنوان اطلاعات پس زمینه به پرسمان اضافه کرده و آن را به مدل بزرگ برای پاسخ به سوالات بر اساس اطلاعات پس زمینه میدهند. LangChain اجزای چارچوب برای بارگیری، تبدیل، ذخیره و پرس و جو اطلاعات فراهم میکند.
اجزای LangChain برای کنترل دادههای خصوصی شامل:
- بارگیری سند: پشتیبانی از بارگیری دادههای سند از منابع مختلف.
- تبدیل سند: تقسیم سند، تبدیل سند به فرمت سوال و جواب، و حذف سندهای تکراری.
- مدل جاسازی متن: تبدیل متنهای بدون ساختار به بردارهای ویژگی برای پشتیبانی از جستجوی شباهت معنایی، مانند پرس و جوی محتوای مشابه با سوال.
- ذخیره سازی بردار: ذخیره و جستجوی دادههای برداری.
- بازیاب: کلاس ابزاری LangChain برای به راحتی پرس و جو در دادههای شما.