الإرشادات
جودة نتائج الاستخراج تعتمد على العديد من العوامل.
إليك مجموعة من الإرشادات لمساعدتك على الحصول على أفضل أداء من نماذجك:
- ضبط درجة حرارة النموذج على
0
. - تحسين الاستفسار. يجب أن يكون الاستفسار دقيقًا وموجزًا.
- توثيق المخطط: تأكد من توثيق المخطط لتوفير مزيد من المعلومات للنموذج اللغوي الشهادي.
- تقديم أمثلة مرجعية! يمكن أن تساعد الأمثلة المتنوعة، بما في ذلك الأمثلة حيث لا يجب استخراج أي معلومات.
- إذا كان لديك الكثير من الأمثلة، استخدم جهاز استرجاع البيانات لاسترداد الأمثلة الأكثر صلة.
- قم بإجراء مقارنة مع أفضل نموذج للّغات الطبيعية/نموذج الدردشة المتاح (على سبيل المثال، gpt-4، claude-3، إلخ) – تحقق مع مزود النموذج لمعرفة النموذج الأحدث والأفضل!
- إذا كان المخطط كبيرًا جدًا، جرب تقسيمه إلى مخططات أصغر، ثم قم بتشغيل عمليات الاستخراج بشكل منفصل وأدمج النتائج.
- تأكد من أن المخطط يسمح للنموذج برفض استخراج المعلومات. إذا كان غير ذلك، سيضطر النموذج إلى ابتكار المعلومات!
- إضافة خطوات التحقق/التصحيح (طلب من النموذج اللغوي الشهادي تصحيح أو التحقق من نتائج الاستخراج).
تذكر!
- النماذج اللغوية الشهادية رائعة، ولكن ليست مطلوبة في جميع الحالات! إذا كنت تستخرج معلومات من مصدر هيكلي واحد (على سبيل المثال، linkedin)، فاستخدام نموذج لغوي شهادي ليس فكرة جيدة – سيكون الحصول على البيانات التقليدية من الويب أرخص وأكثر موثوقية.
- إذا كنت بحاجة إلى جودة مثالية، فمن المرجح أن تحتاج إلى وجود إنسان في الحلقة – حتى أفضل النماذج اللغوية الشهادية سترتكب أخطاء عند التعامل مع مهام الاستخراج المعقدة.