مرور

مدل‌های زبان بزرگ (LLMs) به عنوان یک فناوری بسیار قدرتمند برای انجام برنامه‌های استخراج اطلاعات در حال ظهور هستند.

راه‌حل‌های کلاسیک برای استخراج اطلاعات بر اصول مردم، (بسیاری) قوانین ساخته شده به صورت دستی (مانند عبارت‌های منظم)، و مدل‌های سفارشی تنظیم شده ML بر اساس اتکا دارند.

اینگونه سیستم‌ها به مرور زمان پیچیده می‌شوند و هزینه نگهداری آن‌ها به طور پیوسته افزایش می‌یابد و به نوعی سختی برای بهبود دادن به خود می‌گیرند.

LLMs می‌توانند به سرعت برای وظایف خاص استخراجی فقط با ارائه دادن دستورالعمل‌های مناسب به آن‌ها و مثال‌های مرجع مناسب سازگار شوند.

در این راهنما به شما نشان خواهیم داد چگونه از LLMs برای برنامه‌های استخراج استفاده کنید!

رویکردها

برای استخراج اطلاعات با استفاده از LLMs، سه رویکرد عمده وجود دارد:

  • حالت فراخوانی ابزار/تابع: برخی از LLMs از حالت فراخوانی ابزار یا تابع پشتیبانی می‌کنند. این LLMs می‌توانند خروجی را بر اساس یک طرح داده شده ساختاردهی کنند. به طور کلی، این رویکرد آسان‌تر برای کار است و انتظار می‌رود نتایج خوبی را به دنبال داشته باشد.
  • حالت JSON: برخی از LLMs می‌توانند مجبور شوند که خروجی معتبر JSON ارائه دهند. این موضوع به حالت فراخوانی ابزار/تابع شبیه است، به استثنای اینکه طرح به عنوان بخشی از دستور داده می‌شود. به طور کلی، احساسات ما این است که این عمل کمتر عملکرد خوبی را نسبت به یک حالت فراخوانی ابزار/تابع داشته باشد، اما به این حساب اعتماد نکنید و برای مورد کاربری خودتان تأیید کنید!
  • مبتنی بر دستور: LLMs که به خوبی دستورالعمل‌ها را دنبال می‌کنند، می‌توانند توجیه شوند تا متنی در یک فرمت مطلوب تولید کنند. متن تولید شده می‌تواند در پایین‌آبی به کمک بررسی‌گر‌های خروجی موجود یا استفاده از بررسی‌گر‌های سفارشی به یک فرمت ساختارمند مانند JSON تجزیه شود. این رویکرد می‌تواند با LLMs استفاده شود که از حالت JSON یا حالت فراخوانی ابزار/تابع پشتیبانی نمی‌کنند. این رویکرد گسترده‌تر قابل استفاده است، اما ممکن است نتایج بهتری نسبت به مدل‌هایی که برای استخراج یا فراخوانی تابع تنظیم شده باشند، نداشته باشد.