개요

대형 언어 모델(LLM)은 정보 추출 응용 프로그램을 구동하는 매우 강력한 기술로 등장하고 있습니다.

정보 추출에 대한 고전적인 해결책은 사람, (많은) 수작업 규칙(예: 정규 표현식) 및 맞춤형으로 세밀하게 조정된 ML 모델의 조합에 의존합니다.

이러한 시스템들은 시간이 지남에 따라 복잡해지고 유지보수 비용이 증가하며 개선이 점점 어려워집니다.

LLM은 적절한 지침과 적절한 참조 예제를 제공하기만 하면 특정 추출 작업에 빠르게 적응할 수 있습니다.

이 안내서에서는 LLM을 추출 응용 프로그램에 사용하는 방법을 보여줍니다!

접근 방식

LLM을 사용한 정보 추출에는 3가지 주요 접근 방식이 있습니다:

  • 도구/기능 호출 모드: 일부 LLM은 도구 또는 기능 호출 모드를 지원합니다. 이러한 LLM은 주어진 스키마에 따라 출력을 구조화할 수 있습니다. 일반적으로 이 접근 방식은 작업하기 가장 쉽고 좋은 결과를 얻을 것으로 기대됩니다.
  • JSON 모드: 일부 LLM은 유효한 JSON을 출력하도록 강제할 수 있습니다. 이는 도구/기능 호출 접근 방식과 유사하지만, 스키마가 프롬프트의 일부로 제공됩니다. 일반적으로 우리의 직관에 따르면 이 방법은 도구/기능 호출 접근 방식보다 성능이 떨어질 것으로 예상되지만, 사용 사례에 대해 신뢰하지 마시고 직접 확인하세요!
  • 프롬프팅 기반: 지시를 잘 따르는 LLM은 원하는 형식으로 텍스트를 생성하도록 지시할 수 있습니다. 생성된 텍스트는 기존의 출력 파서나 맞춤형 파서를 사용하여 JSON과 같은 구조화된 형식으로 하류에서 구문 분석될 수 있습니다. 이 접근 방식은 JSON 모드나 도구/기능 호출 모드를 지원하지 않는 LLM과 함께 사용할 수 있으며, 보다 넓은 적용 범위를 갖고 있지만, 추출이나 기능 호출에 대해 세밀하게 조정된 모델보다 나쁜 결과를 낼 수 있습니다.