言語モデル(LM)のトレーニングは情報をたくさん知っていますが、企業の機密データや新しいデータについては知識がありません。多くのLMアプリケーションでは、企業の機密データをクエリし、そのデータをプロンプトに背景情報として結合し、大規模なモデルにフィードして質問に基づいて回答する必要があります。LangChainはデータのロード、変換、保存、クエリのためのフレームワークコンポーネントを提供します。

LangChainの機密データを取り扱うコンポーネントには以下が含まれます:

  • ドキュメントローダー:さまざまなソースから文書データをロードする機能をサポートします。
  • ドキュメントコンバーター:文書を分割し、Q&A形式に変換し、冗長な文書を削除します。
  • テキスト埋め込みモデル:非構造化テキストを特徴ベクトルに変換して、質問と類似したコンテンツをクエリするためにサポートします。
  • ベクトルストレージ:ベクトルデータの保存と検索を行います。
  • レトリーバー:LangChainのカプセル化されたユーティリティクラスで、データを便利にクエリするための機能を提供します。