Carregador de Documentos
O carregador de documentos pode ser usado para carregar dados de várias fontes de dados. Os dados carregados da fonte são armazenados no langchain como um objeto Document
, representando um documento. O objeto Document
contém um trecho de texto e metadados relacionados.
O carregador de documentos expõe um método "carregar" para carregar dados da fonte configurada. Também podem escolher implementar "carregamento preguiçoso" para carregar convenientemente dados na memória em um momento posterior.
Carregando Texto
O carregador mais simples é carregar os dados de texto de um arquivo em um Document
.
from langchain_community.document_loaders import TextLoader
loader = TextLoader("./index.md")
loader.load()
[
Document(page_content='---\\nsidebar_position: 0\\n---\\n# Carregadores de Documentos\\n\\nUse carregadores de documentos para carregar dados de uma fonte como `Documentos`. Um `Documento` é um trecho de texto\\ne metadados associados. Por exemplo, existem carregadores de documentos para carregar um arquivo `.txt` simples, para carregar o texto\\n de qualquer página da web, ou até mesmo para carregar uma transcrição de um vídeo do YouTube.\\n\\nCada carregador de documentos expõe dois métodos:\\n1. "Carregar": carregar documentos da fonte configurada\\n2. "Carregar e dividir": carregar documentos da fonte configurada e dividi-los usando o separador de texto fornecido\\n\\nEles implementam opcionalmente:\\n\\n3. "Carregamento Preguiçoso": carregar documentos na memória de forma preguiçosa\\n', metadata={'source': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]