Dokumentenlader

Der Dokumentenlader kann verwendet werden, um Daten aus verschiedenen Quellen zu laden. Die aus der Quelle geladenen Daten werden im Langchain als ein Document-Objekt gespeichert, das ein Dokument repräsentiert. Das Document-Objekt enthält einen Text und dazugehörige Metadaten.

Der Dokumentenlader bietet eine "load" Methode zum Laden von Daten aus der konfigurierten Datenquelle. Es kann auch entschieden werden, eine "Lazy Load" zu implementieren, um Daten bequem zu einem späteren Zeitpunkt in den Speicher zu laden.

Text laden

Der einfachste Lader ist das Laden der Textdaten einer Datei in ein Document.

from langchain_community.document_loaders import TextLoader

loader = TextLoader("./index.md")
loader.load()
[
    Document(page_content='---\\nsidebar_position: 0\\n---\\n# Dokumentenlader\\n\\nVerwenden Sie Dokumentenlader, um Daten aus einer Quelle als `Document` zu laden. Ein `Document` ist ein Textstück\\nund zugehörige Metadaten. Beispielsweise gibt es Dokumentenlader zum Laden einer einfachen `.txt`-Datei, zum Laden des Textinhalts jeder Webseite\\noder sogar zum Laden eines Transkripts eines YouTube-Videos.\\n\\nJeder Dokumentenlader stellt zwei Methoden bereit:\\n1. "Laden": Dokumente aus der konfigurierten Quelle laden\\n2. "Laden und aufteilen": Dokumente aus der konfigurierten Quelle laden und mit dem übergebenen Text-Splitter aufteilen\\n\\nOptional implementieren sie auch:\\n\\n3. "Lazy Load": Dokumente träge in den Speicher laden\\n', metadata={'source': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]