Panduan

Kualitas hasil ekstraksi bergantung pada banyak faktor.

Berikut adalah serangkaian panduan untuk membantu Anda memperoleh kinerja terbaik dari model Anda:

Atur temperatur model ke 0.
Tingkatkan prompt. Prompt haruslah tepat dan langsung pada tujuannya.
Dokumentasikan skema: Pastikan skema didokumentasikan untuk memberikan lebih banyak informasi kepada LLM.
Berikan contoh referensi! Contoh yang beragam dapat membantu, termasuk contoh di mana tidak ada yang perlu diekstrak.
Jika Anda memiliki banyak contoh, gunakan retriever untuk mengambil contoh yang paling relevan.
Bandingkan dengan Model LLM/Chat terbaik yang tersedia (misalnya, gpt-4, claude-3, dll) – periksa dengan penyedia model untuk mengetahui yang terbaru dan terbaik!
Jika skema sangat besar, coba pecah menjadi beberapa skema yang lebih kecil, jalankan ekstraksi terpisah, dan gabungkan hasilnya.
Pastikan bahwa skema memungkinkan model MENOLAK mengekstrak informasi. Jika tidak, model akan terpaksa membuat informasi palsu!
Tambahkan langkah verifikasi/koreksi (minta LLM untuk memperbaiki atau memverifikasi hasil ekstraksi).

Ingatlah!

Meskipun LLM hebat, namun tidak diperlukan untuk semua kasus! Jika Anda mengekstrak informasi dari sumber terstruktur tunggal (misalnya, linkedin), penggunaan LLM bukanlah ide yang baik – web scraping tradisional akan lebih murah dan dapat diandalkan.
manusia di dalam lingkaran Jika Anda memerlukan kualitas yang sempurna, kemungkinan Anda perlu merencanakan keterlibatan manusia di dalam lingkaran – bahkan LLM terbaik pun akan membuat kesalahan saat menangani tugas ekstraksi yang kompleks.