परिचय
LangChain एक ओपन-सोर्स Python AI एप्लीकेशन विकास फ्रेमवर्क है जो बड़े मॉडल पर आधारित AI एप्लीकेशन बनाने के लिए मॉड्यूल और उपकरण प्रदान करता है। LangChain के माध्यम से, डेवलपर्स बड़े भाषा मॉडल (LLMs) को आसानी से एकीकृत कर सकते हैं और पाठ उत्पन्न करने, सवालों के उत्तर देने, अनुवाद करने, और संवाद आदि के कार्यों को पूरा कर सकते हैं। LangChain एआई एप्लीकेशन विकास की बाधा को कम करता है, जिससे किसी भी व्यक्ति को LLM पर आधारित अपने रचनात्मक एप्लीकेशन बनाने का अवसर मिलता है।
LangChain की विशेषताएँ:
- LLM और प्रॉम्प्ट: LangChain अभ्यंतरण LLM बड़े मॉडलों की सभी API को सारित करता है, बड़े मॉडलों का पहुंच API एकीकृत करता है, और प्रॉम्प्ट टेम्पलेट प्रबंधन यांत्रिकी उपलब्ध करता है।
- चेन: LangChain कुछ सामान्य परिदृश्यों को तैयार मॉड्यूलों में संकलित करता है, जैसे संदर्भ-आधारित सवाल-जवाब प्रणाली, SQL प्रश्नों की प्राकृतिक भाषा उत्पन्नन, आदि, "लब्धि" के नाम से क्योंकि इन कार्यों का क्रियान्वयन का क्रम संकेतकक माना जा सकता है, जो कदम से कदम निष्पादित होता है।
- LCEL: LangChain Expression Language (LCEL) LangChain के नए संस्करण की मूल विशेषता है, जिसे कार्यप्रणाली संरचना समस्याओं को समाधान करने के लिए उपयोग किया जाता है। LCEL अभिव्यंता के माध्यम से, हम ऐक्यक रूप से एआई कार्य प्रसंस्करण प्रवाह को अनुकूलित कर सकते हैं, अर्थात "चेन" को इनक्षुन से अनुकूलित कर सकते हैं।
- पुनर्प्राप्ति युक्त उत्पन्नन (RAG): क्योंकि बड़े भाषा मॉडल (LLM) नई जानकारी को समझना संभावनात्मक नहीं और नए सवालों का जवाब नहीं दे सकते हैं, हम LLM में नई जानकारी भर सकते हैं जिससे उत्पन्न सामग्री की गुणवत्ता में सुधार होती है। इस मोड को "RAG मोड" (पुनर्प्राप्ति युक्त उत्पन्नन) कहा जाता है।
- एजेंट्स: LLM पर आधारित एजेंट्स में एक डिज़ाइन पैटर्न शामिल है जो एलएलएम की प्राकृतिक भाषा समझने और तर्क क्षमताओं का उपयोग करता है (LLM को मस्तिष्क के रूप में) ताकि उपयोगकर्ता के अनुरोधों के आधार पर साथ में बाह्य प्रणालियों और उपकरणों को स्वचालित रूप से बुलाए। उदाहरण के लिए, जब एक उपयोगकर्ता "कल एक दिन की छुट्टी लें" इनपुट करता है, तो बड़े भाषा मॉडल (LLM) स्वचालित रूप से छुट्टी प्रणाली को बुलाता है और छुट्टी आवेदन प्रारंभ करता है।
- मॉडल मेमोरी: बड़े भाषा मॉडल (LLM) को पिछली वार्तालाप सामग्री याद करने की अनुमति देता है, जिसे मॉडल मेमोरी के रूप में जाना जाता है।
LangChain फ्रेमवर्क घटक
LangChain फ्रेमवर्क कई घटकों से मिलकर बना है, जैसे:
- LangChain पुस्तकालय: Python और JavaScript पुस्तकालय। इसमें इंटरफेसों और विभिन्न घटकों का सम्मिलन करने के लिए चालन आधार शामिल है, साथ ही तैयार मॉड्यूल्स और एजेंट्स का अंकलन भी है।
- LangChain टेम्प्लेट्स: LangChain द्वारा प्रदान किए जाने वाले आधिकारिक एआई कार्य टेम्प्लेट्स।
- LangServe: FastAPI पर आधारित, यह LangChain द्वारा परिभाषित श्रृंखलाओं को REST API के रूप में प्रकाशित कर सकता है।
- LangSmith: एक विकास प्लेटफॉर्म, LangChain का समर्थन करता है, एक क्लाउड सेवा है जो LangChain का डीबगिंग और कार्य मॉनिटरिंग समर्थन करती है।
LangChain पुस्तकालय (लाइब्रेरीज)
LangChain पुस्तकालय स्वयं में कई विभिन्न पैकेजों से मिलकर बनती है।
-
langchain-core
: मूल अभिव्यंताएँ और LangChain अभिव्यंता भाषा। -
langchain-community
: थर्ड-पार्टी एकीकरण, मुख्य रूप से LangChain के साथ एकीकृत थर्ड पार्टी घटकों को शामिल करता है। -
langchain
: मुख्य रूप से चेन, एजेंट्स, और पुनर्प्राप्ति युक्त उत्पन्नन तकनीक शामिल है।
LangChain कार्य प्रसंस्करण प्रवाह
उपर्युक्त चित्र में दिखाया गया है कि LangChain प्रॉम्प्ट प्रबंधन उपकरण सेट को संभालने के लिए कम करने के लिए एक प्रॉम्प्ट टेम्प्लेट प्रबंधन उपकरण सेट प्रदान करता है। फिर इसे बड़े मॉडल को प्रक्रिया करने के लिए पाठों को देता है, और अंत में बड़े मॉडल द्वारा वापस आए नतीजों को प्रक्रिया करता है।
LangChain का बड़े मॉडल के संकुचन में मुख्य रूप से दो प्रकार: LLM और चैट मॉडल है।
- LLM - प्रश्नोत्तरी मॉडल जो एक पाठ इनपुट प्राप्त करता है और एक पाठ नतीजा वापस देता है।
- चैट मॉडल - संवाद नमूने में संवादपूर्ण रूप से एक सेट संवाद संदेश प्राप्त करने और संवादात्मक रूप में संवाद में संदेश देने के लिए डिज़ाइन किए गए मॉडल।
मूल अवधारणाएँ
1. LLMs
LangChain द्वारा संकुचित मॉडल जो एक पाठ इनपुट प्राप्त करते हैं और एक पाठ नतीजा वापस देते हैं।
2. चैट मॉडल्स
चैट मॉडल (या संवाद मॉडल) विशेष रूप से संवाद स्थितियों के लिए डिज़ाइन किए गए मॉडल, LLM के विपरीत। ये मॉडल संवाद संवाद के सेट प्राप्त कर सकते हैं और संवादात्मक रूप में संवाद संदेश वापस दे सकते हैं।
3. संदेश
संवाद मॉडल्स में संदेशों की सामग्री का उल्लेख करता है। संदेश प्रकारों में मानव संदेश, AI संदेश, प्रणाली संदेश, और उपकरण संदेश शामिल होते हैं।
4. प्रॉम्प्ट्स
LangChain विशेष रूप से प्रॉम्प्ट प्रबंधन के लिए एक सेट उपकरणों को संकुचित करता है, जो हमें प्रॉम्प्ट सामग्री को संरूपित करने के लिए सुविधाजनक बनाता है।
5. आउटपुट पार्सर
5. पुनर्वाहक
बड़े मॉडल (LLM) में निजी डेटा को आसानी से आयात करने और मॉडल के प्रतिक्रियाओं की गुणवत्ता में सुधार के लिए, LangChain एक पुनर्वाहक ढांचा (Retrievers) को आवरण देता है जो दस्तावेज़ डेटा को लोड, विभाजन, संग्रहण, और पुनर्वापन करने में सहायक होता है।
6. वेक्टर स्टोर
निजी डेटा के लिए अर्थवादी समानता खोजों को समर्थन करने के लिए, LangChain विभिन्न वेक्टर डेटाबेस का समर्थन करता है।
7. एजेंट्स
एजेंट्स, आम तौर पर बड़े मॉडल (LLM) के साथ डिज़ाइन किए जाने वाले अनुप्रयोगों को संदर्भित करते हैं, स्वचालित रूप से उपयोगकर्ता इनपुट पर आधारित उपयोगकर्ता कार्यों को पूरा करने के लिए बाह्य सिस्टम और हार्डवेयर उपकरणों को स्वचालित रूप से बुलाते हैं। यह बड़े मॉडल (LLM) को अपनी मूल धाराओं में एक डिज़ाइन पैटर्न है।
आवेदन स्थितियाँ
- चैटबॉट: बुद्धिमान चैट सहायक, ग्राहक सेवा चैटबॉट्स, और संवादात्मक चैटबॉट्स बनाना।
- ज्ञान-आधार प्रश्न-उत्तर: ज्ञान ग्राफों को साथ मेलकर ओपन-डोमेन प्रश्न-जवाब सेवाएँ प्रदान करना।
- बुद्धिमान लेखन: जैसे लेख लेखन, रचनात्मक लेखन, और पाठ संक्षेपण।