هر چند مدل زبان (LM) آموزش دیده، اطلاعات زیادی را می‌شناسد، اما هنوز اطلاعات خصوصی شرکت و اطلاعات جدید را نمی‌شناسد. بسیاری از برنامه‌های LM برای پرس و جو در داده‌های خصوصی شرکت نیاز دارند، سپس داده‌های خصوصی را به عنوان اطلاعات پس زمینه به پرسمان اضافه کرده و آن را به مدل بزرگ برای پاسخ به سوالات بر اساس اطلاعات پس زمینه می‌دهند. LangChain اجزای چارچوب برای بارگیری، تبدیل، ذخیره و پرس و جو اطلاعات فراهم می‌کند.

اجزای LangChain برای کنترل داده‌های خصوصی شامل:

  • بارگیری سند: پشتیبانی از بارگیری داده‌های سند از منابع مختلف.
  • تبدیل سند: تقسیم سند، تبدیل سند به فرمت سوال و جواب، و حذف سندهای تکراری.
  • مدل جاسازی متن: تبدیل متن‌های بدون ساختار به بردارهای ویژگی برای پشتیبانی از جستجوی شباهت معنایی، مانند پرس و جوی محتوای مشابه با سوال.
  • ذخیره سازی بردار: ذخیره و جستجوی داده‌های برداری.
  • بازیاب: کلاس ابزاری LangChain برای به راحتی پرس و جو در داده‌های شما.