Panduan
Kualitas hasil ekstraksi bergantung pada banyak faktor.
Berikut adalah serangkaian panduan untuk membantu Anda memperoleh kinerja terbaik dari model Anda:
- Atur temperatur model ke
0
. - Tingkatkan prompt. Prompt haruslah tepat dan langsung pada tujuannya.
- Dokumentasikan skema: Pastikan skema didokumentasikan untuk memberikan lebih banyak informasi kepada LLM.
- Berikan contoh referensi! Contoh yang beragam dapat membantu, termasuk contoh di mana tidak ada yang perlu diekstrak.
- Jika Anda memiliki banyak contoh, gunakan retriever untuk mengambil contoh yang paling relevan.
- Bandingkan dengan Model LLM/Chat terbaik yang tersedia (misalnya, gpt-4, claude-3, dll) – periksa dengan penyedia model untuk mengetahui yang terbaru dan terbaik!
- Jika skema sangat besar, coba pecah menjadi beberapa skema yang lebih kecil, jalankan ekstraksi terpisah, dan gabungkan hasilnya.
- Pastikan bahwa skema memungkinkan model MENOLAK mengekstrak informasi. Jika tidak, model akan terpaksa membuat informasi palsu!
- Tambahkan langkah verifikasi/koreksi (minta LLM untuk memperbaiki atau memverifikasi hasil ekstraksi).
Ingatlah!
- Meskipun LLM hebat, namun tidak diperlukan untuk semua kasus! Jika Anda mengekstrak informasi dari sumber terstruktur tunggal (misalnya, linkedin), penggunaan LLM bukanlah ide yang baik – web scraping tradisional akan lebih murah dan dapat diandalkan.
- manusia di dalam lingkaran Jika Anda memerlukan kualitas yang sempurna, kemungkinan Anda perlu merencanakan keterlibatan manusia di dalam lingkaran – bahkan LLM terbaik pun akan membuat kesalahan saat menangani tugas ekstraksi yang kompleks.