Tổng quan
Các Mô hình Ngôn ngữ Lớn (LLMs) đang trỗi dậy như một công nghệ rất có khả năng để cung cấp năng lực cho các ứng dụng trích xuất thông tin.
Các giải pháp cổ điển cho việc trích xuất thông tin dựa vào sự kết hợp giữa con người, (rất nhiều) các quy tắc được tạo thủ công (ví dụ, biểu thức chính quy), và các mô hình máy học được điều chỉnh tinh chỉnh tùy chỉnh.
Những hệ thống như vậy thường trở nên phức tạp theo thời gian và trở nên ngày càng đắt đỏ để duy trì và khó khăn hơn để nâng cấp.
LLMs có thể được thích nghi nhanh chóng cho các nhiệm vụ trích xuất cụ thể chỉ bằng cách cung cấp hướng dẫn phù hợp cho chúng và các ví dụ tham chiếu phù hợp.
Hướng dẫn này sẽ hướng dẫn bạn cách sử dụng LLMs cho các ứng dụng trích xuất!
Các phương pháp
Có 3 phương pháp chính để trích xuất thông tin bằng cách sử dụng LLMs:
- Chế độ Gọi Công cụ/Chức năng: Một số LLM có hỗ trợ chế độ gọi công cụ hoặc chức năng. Các LLM này có thể cấu trúc đầu ra theo một schema cụ thể. Nhìn chung, phương pháp này là dễ dàng để làm việc và dự kiến sẽ mang lại kết quả tốt.
- Chế độ JSON: Một số LLM có thể được ép buộc để tạo ra JSON hợp lệ. Điều này tương tự như chế độ gọi công cụ/chức năng, trừ việc schema được cung cấp như một phần của prompt. Nhìn chung, cảm tính của chúng tôi là phương pháp này hiệu quả kém hơn so với phương pháp gọi công cụ/chức năng, nhưng đừng tin chúng tôi và hãy kiểm chứng cho trường hợp sử dụng của bạn!
- Dựa trên Hỏi Đáp: Các LLM có khả năng làm theo hướng dẫn có thể được chỉ dẫn để tạo ra văn bản theo định dạng mong muốn. Văn bản được tạo ra có thể được phân tích ở bước tiếp theo bằng cách sử dụng Các Trình Phân tích Đầu ra hiện có hoặc sử dụng bộ phân tích tùy chỉnh thành đầu ra có cấu trúc như JSON. Phương pháp này có thể được sử dụng với các LLM mà không hỗ trợ chế độ JSON hoặc chế độ gọi công cụ/chức năng. Phương pháp này có phạm vi áp dụng rộng hơn, tuy nhiên có thể mang lại kết quả kém hơn so với các mô hình đã được điều chỉnh tốt cho việc trích xuất hoặc gọi chức năng.