Meskipun Model Bahasa (LM) yang dilatih tahu banyak informasi, namun masih belum mengetahui tentang data pribadi perusahaan dan data baru. Banyak aplikasi LM perlu mengakses data pribadi perusahaan, kemudian menggabungkan data pribadi tersebut sebagai informasi latar belakang ke dalam perintah, dan memberikannya ke model besar untuk menjawab pertanyaan berdasarkan informasi latar belakang. LangChain menyediakan komponen kerangka kerja untuk memuat, mengubah, menyimpan, dan mengakses data.
Komponen LangChain untuk menangani data pribadi meliputi:
- Pemuat Dokumen: Mendukung memuat data dokumen dari berbagai sumber.
- Konverter Dokumen: Memecah dokumen, mengonversi dokumen ke format tanya jawab, dan menghapus dokumen yang redundan.
- Model Pembaur Teks: Mengubah teks tak terstruktur menjadi vektor fitur untuk mendukung pencarian kesamaan semantik, seperti mencari konten yang mirip dengan pertanyaan.
- Penyimpanan Vektor: Menyimpan dan mencari data vektor.
- Penjaring: Kelas utilitas terenkapsulasi LangChain untuk dengan mudah mengakses data Anda.