বর্ণনা
বড় ভাষা মডেল (LLMs) তথ্য নিষ্কর্ষণ অ্যাপ্লিকেশনগুলি চালানোর জন্য একটি অত্যন্ত সক্ষম প্রযুক্তি হিসাবে দাঁড়াচ্ছে।
তথ্য নিষ্কর্ষণের জন্য শৈলীগত সমাধানগুলি সাধারণভাবে লোক, (অনেক) হ্যান্ড-ক্রাফটেড নিয়মগুলি (উদাহরণ: নিয়মিত অভিব্যক্তি), এবং কাস্টম ফাইন-টিউনড এমএল মডেলের সংমিশ্রণে নির্ভর করে।
এমন সিস্টেমগুলি সময়ে সময়ে জটিল হয় এবং প্রগতির সাথে প্রতিকূল হয় এবং স্বর্ণাঙ্গ করা কঠিন হয়।
LLMs এর ক্ষমতার গভীরভাবে আপেক্ষিক কাজের জন্য তা শীঘ্রই পরিবর্তন করা যেতে পারে, কেবল যখন তাদেরকে উচিত নির্দেশিকা এবং উপযুক্ত সন্দর্ভ উদাহরণ দেওয়া হয়।
এই গাইড তাদের কিভাবে ব্যবহার করতে হয় সেটা দেখাবে!
পদক্ষেপসমূহ
LLMs ব্যবহার করে তথ্য নিষ্কর্ষণের জন্য 3 ধরণের পদক্ষেপ রয়েছে:
- টুল/ফাংশন কলিং মোড: কিছু LLMs একটি টুল বা ফাংশন কলিং মোড সমর্থন করে। এই LLMs গুলি প্রদত্ত স্কিমা অনুসারে আউটপুটের কাঠামো ডিজাইন করতে পারে। সাধারণভাবে, এই পদক্ষেপটি সবচেয়ে সহজ কাজ করতে এবং ভাল ফলাফল দেয়ার প্রত্যাশা করা হয়।
- JSON মোড: কিছু LLMs কে বাধ্য করা যেতে পারে যে তাদের আউটপুটকে বৈধ JSON হিসেবে আউটপুট করা হয়। এটা টুল/ফাংশন কলিং পদক্ষেপের মত। এটা সাধারণভাবে, আমাদের অনুভূতি হল এটা টুল/ফাংশন কলিং পদক্ষেপের চেয়ে খারাপ ফলাফল দেয়, তবে আপনি এটা আপনার নিজের ব্যবহারের চেয়ে পরীক্ষা করুন!
- প্রম্প্টিং ভিত্তিক: অনুসরণপূর্ণভাবে নির্দেশ পালন করতে পারে যে LLMs গুলি প্রযুক্তি বিশ্লেষণের জন্য কার্যকর হতে পারে। প্রজননকৃত পাঠ্য নিমিষ পার্স করার জন্য নিমিত্তশীল আউটপুট ওয়ালা JSON এর মত অন্যত্র ব্যবহার করা যেতে পারে। এই পদক্ষেপটি JSON মোড বা টুল/ফাংশন কলিং মোড সমর্থন করে না তাদের সাথে ব্যবহার করা যেতে পারে। এই পদক্ষেপটি একটি প্রসারিত সুযোগ রয়েছে, তবে হতে পারে যে এটি বিশেষ কেসের জন্য খারাপ ফলাফল দেয় যা মডেলগুলি জন্য নির্দিষ্টভাবে ফাইন-টিউনড হয়নি অথবা ফাংশন কলিং মোডের জন্য।