بارگذاری اسناد
بارگذار اسناد میتواند برای بارگیری دادهها از منابع دادهای مختلف استفاده شود. دادههای بارگیری شده از منبع در زنجیره زبان به عنوان یک شیء "اسناد" ذخیره میشود که یک سند را نمایندگی میکند. شیء "اسناد" شامل یک قطعه متن و متادادههای مرتبط است.
بارگذار اسناد یک متد "بارگیری" را برای بارگیری داده از منبع داده تنظیم شده ارائه میدهد. آنها همچنین میتوانند انتخاب کنند که "بارگیری تنبل" را پیادهسازی کنند تا به راحتی داده را در زمانی بعدی به حافظه بیاورند.
بارگذاری متن
سادهترین بارگذار برای بارگیری دادههای متنی یک فایل به یک "اسناد" است.
from langchain_community.document_loaders import TextLoader
بارگذار = TextLoader("./index.md")
بارگذار.load()
[
Document(page_content='---\\nsidebar_position: 0\\n---\\n# بارگذاری اسناد\\n\\nاز بارگذارهای اسناد برای بارگیری دادهها از یک منبع به عنوان `اسناد` استفاده کنید. `اسناد` یک قطعه متن است\\nو دادههای مرتبط. به عنوان مثال، برای بارگیری یک فایل ساده `.txt`، برای بارگیری محتوای متن\\nهر صفحه وب یا حتی برای بارگیری یک ترانسکریپت ویدئوی یوتیوب.\\n\\nهر بارگذار اسناد دو متد را ارائه میدهد:\\n1. "بارگیری": بارگیری اسناد از منبع تنظیم شده\\n2. "بارگیری و تقسیم": بارگیری اسناد از منبع تنظیم شده و تقسیم آنها با استفاده از تقسیم کننده متن گذاشته شده\\n\\nآنها به طور اختیاری پیادهسازی میشوند:\\n\\n3. "بارگیری تنبل": بارگیری اسناد به صورت تنبلی در حافظه\\n', metadata={'source': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]