مرور
مدلهای زبان بزرگ (LLMs) به عنوان یک فناوری بسیار قدرتمند برای انجام برنامههای استخراج اطلاعات در حال ظهور هستند.
راهحلهای کلاسیک برای استخراج اطلاعات بر اصول مردم، (بسیاری) قوانین ساخته شده به صورت دستی (مانند عبارتهای منظم)، و مدلهای سفارشی تنظیم شده ML بر اساس اتکا دارند.
اینگونه سیستمها به مرور زمان پیچیده میشوند و هزینه نگهداری آنها به طور پیوسته افزایش مییابد و به نوعی سختی برای بهبود دادن به خود میگیرند.
LLMs میتوانند به سرعت برای وظایف خاص استخراجی فقط با ارائه دادن دستورالعملهای مناسب به آنها و مثالهای مرجع مناسب سازگار شوند.
در این راهنما به شما نشان خواهیم داد چگونه از LLMs برای برنامههای استخراج استفاده کنید!
رویکردها
برای استخراج اطلاعات با استفاده از LLMs، سه رویکرد عمده وجود دارد:
- حالت فراخوانی ابزار/تابع: برخی از LLMs از حالت فراخوانی ابزار یا تابع پشتیبانی میکنند. این LLMs میتوانند خروجی را بر اساس یک طرح داده شده ساختاردهی کنند. به طور کلی، این رویکرد آسانتر برای کار است و انتظار میرود نتایج خوبی را به دنبال داشته باشد.
- حالت JSON: برخی از LLMs میتوانند مجبور شوند که خروجی معتبر JSON ارائه دهند. این موضوع به حالت فراخوانی ابزار/تابع شبیه است، به استثنای اینکه طرح به عنوان بخشی از دستور داده میشود. به طور کلی، احساسات ما این است که این عمل کمتر عملکرد خوبی را نسبت به یک حالت فراخوانی ابزار/تابع داشته باشد، اما به این حساب اعتماد نکنید و برای مورد کاربری خودتان تأیید کنید!
- مبتنی بر دستور: LLMs که به خوبی دستورالعملها را دنبال میکنند، میتوانند توجیه شوند تا متنی در یک فرمت مطلوب تولید کنند. متن تولید شده میتواند در پایینآبی به کمک بررسیگرهای خروجی موجود یا استفاده از بررسیگرهای سفارشی به یک فرمت ساختارمند مانند JSON تجزیه شود. این رویکرد میتواند با LLMs استفاده شود که از حالت JSON یا حالت فراخوانی ابزار/تابع پشتیبانی نمیکنند. این رویکرد گستردهتر قابل استفاده است، اما ممکن است نتایج بهتری نسبت به مدلهایی که برای استخراج یا فراخوانی تابع تنظیم شده باشند، نداشته باشد.