Embora o Modelo de Linguagem (LM) treinado saiba muitas informações, ainda não possui conhecimento sobre dados privados empresariais e novos dados. Muitas aplicações do LM precisam consultar dados privados empresariais, em seguida concatenar esses dados privados como informações de fundo na solicitação e alimentar o modelo grande para responder perguntas com base nessas informações de fundo. LangChain fornece componentes de estrutura para carregar, transformar, armazenar e consultar dados.

Os componentes da LangChain para lidar com dados privados incluem:

  • Carregador de Documentos: Suporta o carregamento de dados de documentos de diferentes fontes.
  • Conversor de Documentos: Divide documentos, converte documentos para formatos de perguntas e respostas, e remove documentos redundantes.
  • Modelo de Incorporação de Texto: Converte texto não estruturado em vetores de características para suportar pesquisas de similaridade semântica, como consultar o conteúdo semelhante à pergunta.
  • Armazenamento de Vetores: Armazena e pesquisa dados vetoriais.
  • Recuperador: Classe de utilitário encapsulada da LangChain para consultar convenientemente seus dados.

Imagem