แม้ว่า Language Model (LM) ที่ถูกฝึกฝนมาอย่างดีจะรู้จักข้อมูลมากมาย แต่ก็ยังไม่รู้เรื่องข้อมูลส่วนตัวขององค์กรและข้อมูลใหม่ แอปพลิเคชันของ LM มีความจำเป็นต้องสืบค้นข้อมูลส่วนตัวขององค์กร จากนั้นต่อข้อมูลส่วนตัวเป็นข้อมูลพื้นฐานในคำถาม และส่งให้กับโมเดลขนาดใหญ่ เพื่อตอบคำถามโดยใช้ข้อมูลพื้นฐานนั้น LangChain มีเครื่องมือสำหรับโครงสร้างข้อมูล ตั้งแต่การโหลด การแปลง การเก็บรักษา และการสืบค้นข้อมูล
ส่วนประกอบของ LangChain สำหรับการจัดการข้อมูลส่วนตัว ได้แก่:
- ตัวโหลดเอกสาร: รองรับการโหลดข้อมูลเอกสารจากแหล่งที่แตกต่าง
- ตัวแปลงเอกสาร: แยกเอกสาร แปลงเอกสารเป็นรูปแบบ Q&A และลบเอกสารที่ไม่จำเป็น
- โมเดลฝังเข็มข้นของข้อความ: แปลงข้อความที่ไม่มีโครงสร้างเป็นเวกเตอร์คุณลักษณะ เพื่อสนับสนุนการค้นหาความคล้ายคลึงแบบความหมาย เช่นการสืบค้นเนื้อหาที่คล้ายกับคำถาม
- การจัดเก็บเวกเตอร์: เก็บและค้นหาข้อมูลเวกเตอร์
- ตัวค้นหา: คลาสเครื่องมือที่ถูกซ่อนอยู่ของ LangChain เพื่อสะดวกสบายในการสืบค้นข้อมูลของคุณ