Хотя Языковая Модель (LM), обученная, знает много информации, она все еще не знает о предприятии частные данные и новые данные. Многие приложения LM должны запрашивать предприятии частные данные, затем объединять частные данные в качестве фоновой информации в подсказку и подавать ее на вход крупной модели для ответа на вопросы на основе фоновой информации. LangChain предоставляет компоненты фреймворка для загрузки, преобразования, хранения и запросов данных.

Компоненты LangChain для обработки частных данных включают в себя:

  • Загрузчик Документа: Поддерживает загрузку документов из различных источников.
  • Преобразователь Документа: Разбивает документы, преобразует документы в формат вопрос-ответ и удаляет избыточные документы.
  • Модель Вложения Текста: Преобразует неструктурированный текст в признаковые векторы для поддержки семантического поиска похожего содержимого, такого как запрос содержимого, похожего на вопрос.
  • Хранилище Векторов: Хранит и осуществляет поиск векторных данных.
  • Поисковик: Инкапсулированный утилитарный класс LangChain для удобного запроса ваших данных.