Extrahieren von strukturierten Daten mit LangChain

Überblick

Große Sprachmodelle (LLMs) werden zunehmend als äußerst leistungsfähige Technologie für die Entwicklung von Anwendungen zur Informationsextraktion eingesetzt.

Klassische Lösungen für die Informationsextraktion beruhen auf einer Kombination aus manuellen, (vielen) handgefertigten Regeln (z.B. reguläre Ausdrücke) und individuell angepassten ML-Modellen.

Solche Systeme neigen dazu, im Laufe der Zeit komplex zu werden und werden immer aufwendiger zu warten und schwieriger zu verbessern.

LLMs können schnell für spezifische Extraktionsaufgaben angepasst werden, indem einfach entsprechende Anweisungen und geeignete Beispiele bereitgestellt werden.

In diesem Leitfaden wird gezeigt, wie man LLMs für Extraktionsanwendungen verwendet!

Ansätze

Es gibt 3 grundlegende Ansätze für die Informationsextraktion mit LLMs:

Tool/Funktionsaufruf-Modus: Einige LLMs unterstützen einen Werkzeug- oder Funktionsaufruf-Modus. Diese LLMs können die Ausgabe gemäß einem gegebenen Schema strukturieren. Im Allgemeinen ist dieser Ansatz am einfachsten zu handhaben und verspricht gute Ergebnisse.
JSON-Modus: Einige LLMs können dazu gezwungen werden, gültiges JSON auszugeben. Dies ähnelt dem Tool/Funktionsaufruf-Ansatz, mit der Ausnahme, dass das Schema als Teil des Eingabereizes bereitgestellt wird. Im Allgemeinen gehen wir davon aus, dass dies schlechter funktioniert als der Tool/Funktionsaufruf-Ansatz, aber vertrauen Sie nicht auf uns und überprüfen Sie es für Ihren eigenen Anwendungsfall!
Prompt-basiert: LLMs, die Anweisungen gut befolgen können, können angewiesen werden, Text in einem gewünschten Format zu generieren. Der generierte Text kann nachgelagert mithilfe bestehender Ausgabeparser oder benutzerdefinierter Parser in ein strukturiertes Format wie JSON geparst werden. Dieser Ansatz kann mit LLMs verwendet werden, die den JSON-Modus oder den Werkzeug-/Funktionsaufruf-Modus nicht unterstützen. Dieser Ansatz ist allgemeiner anwendbar, führt jedoch möglicherweise zu schlechteren Ergebnissen als Modelle, die für die Extraktion oder den Funktionsaufruf feinabgestimmt wurden.

Extrahieren von strukturierten Daten mit LangChain

Überblick

Ansätze

Verwandte Tutorials