Traduzione in corso...
Dietro le quinte, Unstructured crea diversi "elementi" per diversi blocchi di testo. Per impostazione predefinita, li combiniamo insieme, ma puoi facilmente preservare questa separazione specificando mode="elements"
.
loader = UnstructuredMarkdownLoader(markdown_path, mode="elements")
data = loader.load()
data[0]
Document(page_content='ð\x9f¦\x9cï¸\x8fð\x9f”\x97 LangChain', metadata={'source': '../../../../../README.md', 'page_number': 1, 'category': 'Title'})