Gambaran umum
Model Bahasa Besar (LLM) mulai muncul sebagai teknologi yang sangat mampu untuk menggerakkan aplikasi ekstraksi informasi.
Solusi klasik untuk ekstraksi informasi bergantung pada kombinasi orang, aturan (banyak) yang dirancang secara manual (misalnya, ekspresi reguler), dan model ML yang disesuaikan secara khusus.
Sistem-sistem tersebut cenderung menjadi kompleks seiring waktu dan menjadi semakin mahal untuk dipelihara dan lebih sulit untuk ditingkatkan.
LLM dapat dengan cepat diadaptasi untuk tugas ekstraksi tertentu hanya dengan memberikan petunjuk yang sesuai kepada mereka dan contoh referensi yang sesuai.
Panduan ini akan menunjukkan cara menggunakan LLM untuk aplikasi ekstraksi!
Pendekatan
Terdapat 3 pendekatan umum untuk ekstraksi informasi menggunakan LLM:
- Mode Pemanggilan Alat/Fungsi: Beberapa LLM mendukung mode pemanggilan alat atau fungsi. LLM ini dapat membangun keluaran sesuai dengan skema yang diberikan. Umumnya, pendekatan ini merupakan yang paling mudah untuk digunakan dan diharapkan menghasilkan hasil yang baik.
- Mode JSON: Beberapa LLM dapat dipaksa untuk menghasilkan JSON yang valid. Ini mirip dengan pendekatan pemanggilan alat/fungsi, kecuali bahwa skema disediakan sebagai bagian dari rangsangan. Umumnya, intuisi kami adalah bahwa ini akan memiliki performa lebih buruk daripada pendekatan pemanggilan alat/fungsi, tetapi tidak percaya pada kami dan verifikasi untuk kasus penggunaan Anda sendiri!
- Berbasis Pemberian Petunjuk: LLM yang dapat mengikuti petunjuk dengan baik dapat diarahkan untuk menghasilkan teks dalam format yang diinginkan. Teks yang dihasilkan dapat diparsing secara hilir menggunakan Parser Keluaran yang ada atau menggunakan parser kustom ke dalam format terstruktur seperti JSON. Pendekatan ini dapat digunakan dengan LLM yang tidak mendukung mode JSON atau mode pemanggilan alat/fungsi. Pendekatan ini lebih luas dalam penerapannya, meskipun mungkin menghasilkan hasil yang lebih buruk daripada model yang telah disesuaikan secara baik untuk ekstraksi atau pemanggilan fungsi.