Cargador de documentos

El cargador de documentos puede utilizarse para cargar datos desde distintas fuentes de datos. Los datos cargados desde la fuente se almacenan en el langchain como un objeto Documento, representando un documento. El objeto Documento contiene un fragmento de texto y metadatos relacionados.

El cargador de documentos expone un método "cargar" para cargar datos desde la fuente de datos configurada. También se puede optar por implementar la "carga diferida" para cargar convenientemente los datos en la memoria en un momento posterior.

Carga de texto

El cargador más simple es cargar los datos de texto de un archivo en un Documento.

from langchain_community.document_loaders import TextLoader

cargador = TextLoader("./index.md")
cargador.load()
[
    Document(page_content='---\\nsidebar_position: 0\\n---\\n# Cargadores de documentos\\n\\nUtiliza los cargadores de documentos para cargar datos desde una fuente como objetos `Documento`. Un `Documento` es un fragmento de texto\\ny metadatos asociados. Por ejemplo, hay cargadores de documentos para cargar un archivo simple `.txt`, para cargar el contenido de texto\\nde cualquier página web, e incluso para cargar una transcripción de un video de YouTube.\\n\\nCada cargador de documentos expone dos métodos:\\n1. "Cargar": cargar documentos desde la fuente configurada\\n2. "Cargar y dividir": cargar documentos desde la fuente configurada y dividirlos usando el separador de texto proporcionado\\n\\nOpcionalmente implementan:\\n\\n3. "Carga diferida": cargar documentos en la memoria de forma perezosa\\n', metadata={'source': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]