Panduan

Kualitas hasil ekstraksi bergantung pada banyak faktor.

Berikut adalah serangkaian panduan untuk membantu Anda memperoleh kinerja terbaik dari model Anda:

  • Atur temperatur model ke 0.
  • Tingkatkan prompt. Prompt haruslah tepat dan langsung pada tujuannya.
  • Dokumentasikan skema: Pastikan skema didokumentasikan untuk memberikan lebih banyak informasi kepada LLM.
  • Berikan contoh referensi! Contoh yang beragam dapat membantu, termasuk contoh di mana tidak ada yang perlu diekstrak.
  • Jika Anda memiliki banyak contoh, gunakan retriever untuk mengambil contoh yang paling relevan.
  • Bandingkan dengan Model LLM/Chat terbaik yang tersedia (misalnya, gpt-4, claude-3, dll) – periksa dengan penyedia model untuk mengetahui yang terbaru dan terbaik!
  • Jika skema sangat besar, coba pecah menjadi beberapa skema yang lebih kecil, jalankan ekstraksi terpisah, dan gabungkan hasilnya.
  • Pastikan bahwa skema memungkinkan model MENOLAK mengekstrak informasi. Jika tidak, model akan terpaksa membuat informasi palsu!
  • Tambahkan langkah verifikasi/koreksi (minta LLM untuk memperbaiki atau memverifikasi hasil ekstraksi).

Ingatlah!

  • Meskipun LLM hebat, namun tidak diperlukan untuk semua kasus! Jika Anda mengekstrak informasi dari sumber terstruktur tunggal (misalnya, linkedin), penggunaan LLM bukanlah ide yang baik – web scraping tradisional akan lebih murah dan dapat diandalkan.
  • manusia di dalam lingkaran Jika Anda memerlukan kualitas yang sempurna, kemungkinan Anda perlu merencanakan keterlibatan manusia di dalam lingkaran – bahkan LLM terbaik pun akan membuat kesalahan saat menangani tugas ekstraksi yang kompleks.