محمل المستندات

يمكن استخدام محمل المستندات لتحميل البيانات من مصادر بيانات مختلفة. البيانات المحملة من المصدر تُخزن في سلسلة اللغة ككائن "مستند"، الذي يمثل مستندًا. يحتوي كائن "المستند" على قطعة نص والبيانات الوصفية المتعلقة.

يوفر محمل المستندات طريقة "تحميل" لتحميل البيانات من مصدر البيانات المكون. يمكنهم أيضًا اختيار تنفيذ "تحميل كسول" لتحميل البيانات بشكل مريح إلى الذاكرة في وقتٍ لاحق.

تحميل النص

أبسط محمل هو تحميل بيانات النص من ملف إلى "مستند".

from langchain_community.document_loaders import TextLoader

loader = TextLoader("./index.md")
loader.load()
[
    Document(page_content='---\\nsidebar_position: 0\\n---\\n# محملات المستندات\\n\\nاستخدم محملات المستندات لتحميل البيانات من مصدر كـ `Document`\\nهي قطعة نص والبيانات المتعلقة. على سبيل المثال، هناك محملات مستندات لتحميل ملف `.txt` بسيط، لتحميل محتوى النص من أي صفحة ويب، أو حتى لتحميل نص محادثة فيديو يوتيوب.\\n\\nيوفر كل محمل مستندات طريقتين:\\n1. "تحميل": لتحميل المستندات من مصدر التكوين\\n2. "تحميل وتقسيم": لتحميل المستندات من مصدر التكوين وتقسيمها باستخدام جزاز النص الممرر.\\n\\nينفذون اختياريًا:\\n\\n3. "تحميل كسول": لتحميل المستندات إلى الذاكرة بشكل كسول\\n', metadata={'source': '../docs/docs_skeleton/docs/modules/data_connection/document_loaders/index.md'})
]