Pemuat Dokumen

Pemuat dokumen dapat digunakan untuk memuat data dari berbagai sumber data. Data yang dimuat dari sumber disimpan dalam langchain sebagai objek Dokumen, yang mewakili sebuah dokumen. Objek Dokumen berisi sepotong teks dan metadata terkait.

Pemuat dokumen mengekspos metode "muat" untuk memuat data dari sumber data yang dikonfigurasi. Mereka juga dapat memilih untuk mengimplementasikan "muat malas" untuk dengan mudah memuat data ke dalam memori di waktu yang lebih lambat.

Memuat Teks

Pemuat paling sederhana adalah memuat data teks sebuah file ke dalam suatu Dokumen.

from langchain_community.document_loaders import TextLoader

loader = TextLoader("./index.md")
loader.load()
[
    Dokumen(konten_halaman='---\\nsidebar_position: 0\\n---\\n# Pemuat dokumen\\n\\nGunakan pemuat dokumen untuk memuat data dari sumber sebagai `Dokumen`\\'s. Sebuah `Dokumen` adalah sepotong teks\\ndan metadata terkait. Misalnya, ada pemuat dokumen untuk memuat file `.txt` sederhana, untuk memuat teks\\ndari halaman web mana pun, atau bahkan untuk memuat transkrip dari video YouTube.\\n\\nSetiap pemuat dokumen mengekspos dua metode:\\n1. "Muat": muat dokumen dari sumber yang dikonfigurasi\\n2. "Muat dan pisah": muat dokumen dari sumber yang dikonfigurasi dan membaginya menggunakan pemisah teks yang dilewatkan\\n\\nMereka opsional mengimplementasikan:\\n\\n3. "Muat malas": muat dokumen ke dalam memori secara malas\\n', metadata={'sumber': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]