بارگذاری اسناد

بارگذار اسناد می‌تواند برای بارگیری داده‌ها از منابع داده‌ای مختلف استفاده شود. داده‌های بارگیری شده از منبع در زنجیره زبان به عنوان یک شیء "اسناد" ذخیره می‌شود که یک سند را نمایندگی می‌کند. شیء "اسناد" شامل یک قطعه متن و متاداده‌های مرتبط است.

بارگذار اسناد یک متد "بارگیری" را برای بارگیری داده از منبع داده تنظیم شده ارائه می‌دهد. آنها همچنین می‌توانند انتخاب کنند که "بارگیری تنبل" را پیاده‌سازی کنند تا به راحتی داده را در زمانی بعدی به حافظه بیاورند.

بارگذاری متن

ساده‌ترین بارگذار برای بارگیری داده‌های متنی یک فایل به یک "اسناد" است.

from langchain_community.document_loaders import TextLoader

بارگذار = TextLoader("./index.md")
بارگذار.load()
[
    Document(page_content='---\\nsidebar_position: 0\\n---\\n# بارگذاری اسناد\\n\\nاز بارگذارهای اسناد برای بارگیری داده‌ها از یک منبع به عنوان `اسناد` استفاده کنید. `اسناد` یک قطعه متن است\\nو داده‌های مرتبط. به عنوان مثال، برای بارگیری یک فایل ساده `.txt`، برای بارگیری محتوای متن\\nهر صفحه وب یا حتی برای بارگیری یک ترانسکریپت ویدئوی یوتیوب.\\n\\nهر بارگذار اسناد دو متد را ارائه می‌دهد:\\n1. "بارگیری": بارگیری اسناد از منبع تنظیم شده\\n2. "بارگیری و تقسیم": بارگیری اسناد از منبع تنظیم شده و تقسیم آن‌ها با استفاده از تقسیم کننده متن گذاشته شده\\n\\nآنها به طور اختیاری پیاده‌سازی می‌شوند:\\n\\n3. "بارگیری تنبل": بارگیری اسناد به صورت تنبلی در حافظه\\n', metadata={'source': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]