Introduzione all'elaborazione dei dati locali con LangChain

Anche se il Language Model (LM) addestrato conosce molte informazioni, non sa ancora nulla sui dati privati dell'azienda e sui nuovi dati. Molte applicazioni LM devono interrogare i dati privati dell'azienda, quindi concatenare i dati privati come informazioni di background nel prompt e alimentarli al grande modello per rispondere alle domande basate sulle informazioni di background. LangChain fornisce componenti di framework per caricare, trasformare, memorizzare e interrogare i dati.

I componenti di LangChain per gestire i dati privati includono:

Caricatore di documenti: supporta il caricamento di dati documentali da diverse fonti.
Convertitore di documenti: suddivide i documenti, converte i documenti in formato domanda e risposta e rimuove i documenti ridondanti.
Modello di embedding del testo: converte il testo non strutturato in vettori di caratteristiche per supportare la ricerca di similarità semantica, come ad esempio interrogare contenuti simili alla domanda.
Archiviazione vettoriale: memorizza e ricerca dati vettoriali.
Retriever: classe di utilità incapsulata di LangChain per interrogare comodamente i tuoi dati.

Tutorial Correlati