Mimo że Model Językowy (LM) jest przeszkolony i posiada dużą ilość informacji, to nadal nie wie o prywatnych danych przedsiębiorstwa oraz o nowych danych. Wiele zastosowań LM wymaga zapytania o prywatne dane przedsiębiorstwa, a następnie połączenia tych danych jako informacji tła do polecenia i przekazania ich do dużego modelu, aby odpowiedzieć na pytania bazując na tych informacjach. LangChain dostarcza komponenty frameworku do ładowania, przekształcania, przechowywania i zapytywania danych.

Komponenty LangChain do obsługi prywatnych danych obejmują:

  • Ładowacz Dokumentów: Obsługuje ładowanie danych dokumentów z różnych źródeł.
  • Konwerter Dokumentów: Dzieli dokumenty, konwertuje je na format Q&A i usuwa nadmiarowe dokumenty.
  • Model Osadzeń Tekstu: Konwertuje tekst nieustrukturyzowany na wektory cech wspierające wyszukiwanie podobieństw semantycznych, takie jak zapytania o treści podobne do pytania.
  • Przechowywanie Wektorów: Przechowuje i wyszukuje dane wektorowe.
  • Odnajdywacz: Umieszczona w LangChain klasa narzędziowa do wygodnego zapytywania Twoich danych.