Obwohl das Language Model (LM) viel Wissen besitzt, kennt es dennoch keine Unternehmens-Interna und neue Daten. Viele LM-Anwendungen müssen auf Unternehmens-Interna zugreifen, dann diese privaten Daten als Hintergrundinformationen an die Anfrage anhängen und sie dem großen Modell zur Beantwortung von Fragen auf Basis dieser Hintergrundinformationen bereitstellen. LangChain bietet Framework-Komponenten zum Laden, Transformieren, Speichern und Abfragen von Daten an.

Die Komponenten von LangChain zur Bearbeitung von privaten Daten umfassen:

  • Dokumenten-Lader: Unterstützt das Laden von Dokumentendaten aus verschiedenen Quellen.
  • Dokumenten-Konverter: Teilt Dokumente auf, wandelt sie in das Frage-Antwort-Format um und entfernt überflüssige Dokumente.
  • Text-Einbettungsmodell: Wandelt unstrukturierten Text in Merkmalsvektoren um, um semantische Ähnlichkeitssuche zu unterstützen, wie beim Abfragen von Inhalten, die ähnlich der gestellten Frage sind.
  • Vektor-Speicher: Speichert und durchsucht Vektordaten.
  • Retriever: LangChain's encapsulated utility class for conveniently querying your data.