الإرشادات

جودة نتائج الاستخراج تعتمد على العديد من العوامل.

إليك مجموعة من الإرشادات لمساعدتك على الحصول على أفضل أداء من نماذجك:

  • ضبط درجة حرارة النموذج على 0.
  • تحسين الاستفسار. يجب أن يكون الاستفسار دقيقًا وموجزًا.
  • توثيق المخطط: تأكد من توثيق المخطط لتوفير مزيد من المعلومات للنموذج اللغوي الشهادي.
  • تقديم أمثلة مرجعية! يمكن أن تساعد الأمثلة المتنوعة، بما في ذلك الأمثلة حيث لا يجب استخراج أي معلومات.
  • إذا كان لديك الكثير من الأمثلة، استخدم جهاز استرجاع البيانات لاسترداد الأمثلة الأكثر صلة.
  • قم بإجراء مقارنة مع أفضل نموذج للّغات الطبيعية/نموذج الدردشة المتاح (على سبيل المثال، gpt-4، claude-3، إلخ) – تحقق مع مزود النموذج لمعرفة النموذج الأحدث والأفضل!
  • إذا كان المخطط كبيرًا جدًا، جرب تقسيمه إلى مخططات أصغر، ثم قم بتشغيل عمليات الاستخراج بشكل منفصل وأدمج النتائج.
  • تأكد من أن المخطط يسمح للنموذج برفض استخراج المعلومات. إذا كان غير ذلك، سيضطر النموذج إلى ابتكار المعلومات!
  • إضافة خطوات التحقق/التصحيح (طلب من النموذج اللغوي الشهادي تصحيح أو التحقق من نتائج الاستخراج).

تذكر!

  • النماذج اللغوية الشهادية رائعة، ولكن ليست مطلوبة في جميع الحالات! إذا كنت تستخرج معلومات من مصدر هيكلي واحد (على سبيل المثال، linkedin)، فاستخدام نموذج لغوي شهادي ليس فكرة جيدة – سيكون الحصول على البيانات التقليدية من الويب أرخص وأكثر موثوقية.
  • إذا كنت بحاجة إلى جودة مثالية، فمن المرجح أن تحتاج إلى وجود إنسان في الحلقة – حتى أفضل النماذج اللغوية الشهادية سترتكب أخطاء عند التعامل مع مهام الاستخراج المعقدة.