LangChain ডকুমেন্ট লোডিং ডেটা

ডকুমেন্ট লোডার

ডকুমেন্ট লোডারটি বিভিন্ন ডেটা উৎস থেকে ডেটা লোড করতে ব্যবহার করা যেতে পারে। এই লোড করা ডেটা টি langchain এ একটি "ডকুমেন্ট" অবজেক্ট হিসেবে সংরক্ষিত হয়, যা একটি ডকুমেন্ট প্রতিনিধিত্ব করে। "ডকুমেন্ট" অবজেক্টটি একটি পাঠ এবং সম্পর্কিত মেটাডেটা ধরে।

ডকুমেন্ট লোডারটি "লোড" মেথড প্রদর্শন করে যাতে কনফিগার ডেটা উৎস থেকে ডেটা লোড করা যেতে পারে। তারা পরবর্তীতে সহজে ডেটা লোড করার জন্য "লেজি লোড" ইমপ্লিমেন্ট করতে পারে।

টেক্সট লোড করা

সবচেয়ে সাধারণ লোডার হ'ল একটি ফাইলের টেক্সট ডেটা টি একটি "ডকুমেন্ট" এ লোড করা।

from langchain_community.document_loaders import TextLoader

loader = TextLoader("./index.md")
loader.load()

লোড করা ডেটা -

[
    Document(page_content='---\\nsidebar_position: 0\\n---\\n# Document loaders\\n\\nUse document loaders to load data from a source as `Document`\\'s. A `Document` is a piece of text\\nand associated metadata. For example, there are document loaders for loading a simple `.txt` file, for loading the text\\ncontents of any web page, or even for loading a transcript of a YouTube video.\\n\\nEvery document loader exposes two methods:\\n1. "Load": load documents from the configured source\\n2. "Load and split": load documents from the configured source and split them using the passed in text splitter\\n\\nThey optionally implement:\\n\\n3. "Lazy load": load documents into memory lazily\\n', metadata={'source': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]

ডকুমেন্ট লোডার

টেক্সট লোড করা

সম্পর্কিত টিউটরিয়াল