Panoramica
I Large Language Models (LLM) stanno emergendo come una tecnologia estremamente capace per alimentare le applicazioni di estrazione delle informazioni.
Le soluzioni classiche per l'estrazione delle informazioni si basano su una combinazione di persone, (molte) regole artigianali (ad esempio, espressioni regolari) e modelli di ML personalizzati e ottimizzati.
Tali sistemi tendono a diventare complessi nel tempo e diventano progressivamente più costosi da mantenere e più difficili da migliorare.
I LLM possono essere adattati rapidamente per compiti di estrazione specifici semplicemente fornendo loro istruzioni appropriate ed esempi di riferimento appropriati.
Questa guida ti mostrerà come utilizzare i LLM per le applicazioni di estrazione!
Approcci
Ci sono 3 approcci principali per l'estrazione delle informazioni utilizzando i LLM:
- Modalità Chiamata di Strumenti/Funzioni: Alcuni LLM supportano una modalità di chiamata di strumenti o funzioni. Questi LLM possono strutturare l'output secondo uno schema dato. In generale, questo approccio è il più facile da utilizzare e si prevede che produca buoni risultati.
- Modalità JSON: Alcuni LLM possono essere forzati a produrre JSON valido. Questo è simile all'approccio chiamata di strumenti/funzioni, tranne che lo schema è fornito come parte del prompt. In generale, l'intuizione è che questo performi peggio rispetto a un approccio di chiamata di strumenti/funzioni, ma non fidarti di noi e verifica il tuo caso d'uso!
- Basato sul Prompt: I LLM che sanno seguire bene le istruzioni possono essere istruiti a generare testo in un formato desiderato. Il testo generato può essere analizzato a valle utilizzando parser di output esistenti o parser personalizzati in un formato strutturato come JSON. Questo approccio può essere utilizzato con i LLM che non supportano la modalità JSON o le modalità di chiamata di strumenti/funzioni. Questo approccio è più ampiamente applicabile, anche se potrebbe produrre risultati peggiori rispetto ai modelli che sono stati ottimizzati per l'estrazione o la chiamata di funzioni.