ภาพรวม
Large Language Models (LLMs) กำลังเป็นเทคโนโลยีที่มีความสามารถมากมายในการขับเคลื่อนแอปพลิเคชันการสกัดข้อมูล
การแก้ปัญหาการสกัดข้อมูลแบบดั้งเดิมพึงพึงก็หมายถึงการใช้คน (มากมาย) วางกันมา (เช่น การใช้ regular expressions) และโมเดล ML ที่ถูกปรับแต่งอย่างดีแบบแบบหลักการ
ระบบเช่นนี้มักจะกลายเป็นระบบที่ซับซ้อนขึ้นตามเวลาและกลายมากขึ้นในการบำรุงรักษาโดยที่มันยากขึ้นทีหรือหากแก่งการเสริม
LLMs สามารถใช้การป้อนคำเตือนทำเครื่องงงงงงงงในงงงได้อย่างรวดเร็วสำหรับงานสกัดข้อมูลที่เฉพาะเจาะจงโดยการให้คำความหมายที่เหมาะสมและตัวอย่างที่สอดคล้อง
คู่มือนี้จะแสดงให้คุณเห็นว่าการใช้ LLMs สำหรับแอปพลิเคชันการสกัดข้อมูล!
วิธีการ
มี 3 วิธีการหลัก ในการสกัดข้อมูลโดยใช้ LLMs:
- โหมดการเรียกใช้เครื่องมือ/ฟังก์ชัน: บาง LLMs สนับสนุน โหมดการเรียกใช้เครื่องมือหรือฟังก์ชัน พวก LLMs พวกนี้สามารถสร้างโครงสร้างผลลัพธ์ตาม สกีม่า ที่กำหนด เลยีความสะดวกในการใช้งานอย่างทั่วไปและคาดว่าจะให้ผลลัพธ์ที่ดี
- โหมด JSON: บาง LLMs สามารถปรับให้เอาตัวเลข ที่ดูเป็น valid JSON นี่คล้ายกับ โหมดการเรียกใช้เครื่องมือหรือฟังก์ชัน โดยให้กฟำหนดสกีม่าเป็นส่วนหนึ่งของคำความเต็มทั้งนี้เราคาดการณ์ว่านี่จะให้ผลลัพธ์ที่แย่กว่า โหมดการเรียกใช้เครื่องมือหรือฟังก์ชัน อย่าเชื่อเราให้ตรวจสอบสำหรับภาคใช้ของคุณเอง!
- การ Pointering Base: LLMs ที่สามารถทำตามคำความงงงงงงงงงงงงงงสามารถครอบครองได้อย่างดีสามารถสั่งให้สร้างข้อความที่ตรงตามรูปแบบที่ต้องการผลลัพธ์ที่สร้างขึ้นสามารถแปลการข้อมูลลงในช่องชื่อปลายได้โดยใช้การแกว้งผลที่เคยตั้งไว้หรือการใช้ผลการแกว้งแบบกำหนดเองเป็นโครงสร้างเช่น JSON วิธีการนี้สามารถใช้กับ LLMs ที่ ไม่สนับสนุน โหมด JSON หรือโหมดการตรวจการของเครื่องหรือฟังชันการเรียก วิธีการนี้สามารถใช้กับ LLMs ที่พัฒนาการขึ้นบดีขึ้นเทียบกับโมเดลที่ผ่านการปรับแต่งอย่างดีสำหรับการสกัดข้อมูลหรือการเริสชื่อปลาย