Aperçu

Les grands modèles de langage (GML) émergent comme une technologie extrêmement capable pour alimenter les applications d'extraction d'informations.

Les solutions classiques d'extraction d'informations reposent sur une combinaison de personnes, de règles faites à la main (par exemple, expressions régulières) et de modèles ML personnalisés et finement réglés.

Ces systèmes ont tendance à devenir complexes au fil du temps et deviennent progressivement plus coûteux à maintenir et plus difficiles à améliorer.

Les GML peuvent être adaptés rapidement pour des tâches d'extraction spécifiques simplement en leur fournissant des instructions appropriées et des exemples de référence appropriés.

Ce guide vous montrera comment utiliser les GML pour des applications d'extraction !

Approches

Il existe 3 grandes approches pour l'extraction d'informations à l'aide des GML :

  • Mode Appel d'Outil/Fonction : Certains GML prennent en charge un mode d'appel d'outil ou de fonction. Ces GML peuvent structurer la sortie selon un schéma donné. En général, cette approche est la plus facile à utiliser et devrait donner de bons résultats.
  • Mode JSON : Certains GML peuvent être contraints de produire du JSON valide. Cela est similaire à l'approche d'appel d'outil/fonction, sauf que le schéma est fourni en tant que partie de l'invite. En général, notre intuition est que cela fonctionne moins bien qu'une approche d'appel d'outil/fonction, mais ne nous croyez pas sur parole et vérifiez-le pour votre propre cas d'utilisation !
  • Basé sur Instructions : Les GML qui peuvent bien suivre des instructions peuvent être instruits pour générer du texte dans un format désiré. Le texte généré peut être analysé en aval à l'aide de parseurs de sortie existants ou de parseurs personnalisés dans un format structuré tel que JSON. Cette approche peut être utilisée avec des GML qui ne prennent pas en charge le mode JSON ou les modes d'appel d'outil/fonction. Cette approche est plus largement applicable, bien qu'elle puisse donner de moins bons résultats que les modèles qui ont été finement réglés pour l'extraction ou l'appel de fonction.