Caricatore di documenti

Il caricatore di documenti può essere utilizzato per caricare dati da varie fonti di dati. I dati caricati dalla sorgente sono memorizzati nella catena di lingue come oggetto Document, che rappresenta un documento. L'oggetto Document contiene un pezzo di testo e metadati correlati.

Il caricatore di documenti espone un metodo "carica" per caricare dati dalla sorgente configurata. È anche possibile scegliere di implementare il "caricamento pigro" per caricare comodamente i dati in memoria in un secondo momento.

Caricamento di testo

Il caricatore più semplice è quello di caricare i dati testuali di un file in un Documento.

from langchain_community.document_loaders import TextLoader

loader = TextLoader("./index.md")
loader.load()
[
    Document(page_content='---\\nsidebar_position: 0\\n---\\n# Caricatori di documenti\\n\\nUtilizza i caricatori di documenti per caricare dati da una fonte come `Documenti`. Un `Documento` è un pezzo di testo\\ne metadati associati. Ad esempio, ci sono dei caricatori di documenti per caricare un semplice file `.txt`, per caricare i contenuti testuali\\n di qualsiasi pagina web, o anche per caricare una trascrizione di un video di YouTube.\\n\\nOgni caricatore di documenti espone due metodi:\\n1. "Carica": carica documenti dalla sorgente configurata\\n2. "Carica e suddividi": carica documenti dalla sorgente configurata e li suddivide utilizzando il divisore di testo passato\\n\\nOpzionalmente implementano:\\n\\n3. "Caricamento pigro": carica i documenti in memoria in modo pigro\\n', metadata={'source': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]