Extracción de datos estructurados con LangChain

Visión general

Los Modelos de Lenguaje Grandes (LLM) están emergiendo como una tecnología extremadamente capaz para alimentar aplicaciones de extracción de información.

Las soluciones clásicas para la extracción de información dependen de una combinación de personas, (muchas) reglas hechas a mano (por ejemplo, expresiones regulares) y modelos de ML personalizados y ajustados.

Tales sistemas tienden a volverse complicados con el tiempo y se vuelven progresivamente más caros de mantener y más difíciles de mejorar.

Los LLM pueden adaptarse rápidamente para tareas de extracción específicas solo proporcionándoles instrucciones adecuadas y ejemplos de referencia adecuados.

¡Esta guía te mostrará cómo utilizar LLMs para aplicaciones de extracción!

Enfoques

Existen 3 enfoques amplios para la extracción de información utilizando LLMs:

Modo de Llamada a Herramienta/Función: Algunos LLMs admiten un modo de llamada a herramienta o función. Estos LLMs pueden estructurar la salida según un esquema dado. En general, este enfoque es el más fácil de trabajar y se espera que produzca buenos resultados.
Modo JSON: Algunos LLMs pueden ser forzados a producir JSON válido. Esto es similar al enfoque de llamada a herramienta/función, excepto que el esquema se proporciona como parte de la indicación. En general, nuestra intuición es que esto funciona peor que un enfoque de llamada a herramienta/función, ¡pero no confíes en nosotros y verifica tu propio caso de uso!
Basado en Indicaciones: Los LLMs que pueden seguir instrucciones bien pueden ser instruidos para generar texto en un formato deseado. El texto generado puede ser analizado aguas abajo usando Analizadores de Salida existentes o usando analizadores personalizados para convertirlo en un formato estructurado como JSON. Este enfoque se puede utilizar con LLMs que no admiten el modo JSON o modos de llamada a herramienta/función. Este enfoque es más ampliamente aplicable, aunque puede producir peores resultados que los modelos que han sido ajustados para la extracción o la llamada a funciones.

Extracción de datos estructurados con LangChain

Visión general

Enfoques

Tutoriales Relacionados