Python Milvus खोज मापदंड

शर्त सवाल

यह विषय शर्त सवाल करने के तरीके को पेश करता है।

वेक्टर पर समानता खोजने की तरह, शर्त सवाल स्केलर फ़िल्टर का उपयोग सम्पूर्ण संख्यात्मक उदाहरणों के माध्यम से वेक्टर को हासिल करता है। Milvus स्कैलर फ़ील्ड और विभिन्न बूलियन अभिव्यक्तियों पर क्वेरी समर्थन करता है। बूलियन अभिव्यक्तियों का उपयोग स्कैलर फ़ील्ड या प्राथमिक कुंजी फ़ील्ड को फ़िल्टर करने के लिए किया जा सकता है ताकि फ़िल्टरिंग शर्तों से मेल खाते सभी परिणाम प्राप्त किए जा सकें।

निम्नलिखित उदाहरण दिखाता है कि कैसे 2000 पंक्तियों के पुस्तकों के डेटासेट को क्वेरी करना,जिसमें पुस्तक आईडी (प्राथमिक कुंजी), शब्द गणना (स्केलर फ़ील्ड) और पुस्तक परिचय (वेक्टर फ़ील्ड) शामिल है, के किसी विशिष्ट पुस्तक की आईडी के आधार पर क्वेरी करने की स्थिति का नकल करने के लिए कैसे।

संग्रह लोड करें

क्वेरी आयोजित करने से पहले, संग्रह को मेमोरी में लोड किया जाना चाहिए।

from pymilvus import Collection
collection = Collection("book")      # मौजूदा संग्रह प्राप्त करें।
collection.load()

क्वेरी का निष्पादन

निम्नलिखित उदाहरण विशिष्ट book_id मानों के आधार पर वेक्टर को फ़िल्टर करता है और परिणामों में book_id फ़ील्ड और book_intro फ़ील्ड लौटाता है।

Milvus क्वेरी के लिए संदर्भता स्तर सेट करने का समर्थन करता है। इस विषय में उदाहरण का संगर्भ स्तर मजबूत सेट करता है। आप संगर्भ स्तर को सीमित, सत्र, या आखिरकर तक सेट कर सकते हैं। Milvus में चार संगर्भ स्तरों पर अधिक जानकारी के लिए, कृपया संगर्भता स्तर पर संलग्नता के लिए संविदान करें।

आप फ़िल्टर अभिव्यक्ति में डायनामिक फ़ील्ड भी उपयोग कर सकते हैं और क्वेरी अनुरोध में आउटपुट फ़ील्ड निर्धारित कर सकते हैं। उदाहरण के लिए, डायनामिक स्कीमा के लिए देखें।

res = collection.query(
  expr = "book_id in [2,4,6,8]",
  offset = 0,
  limit = 10, 
  output_fields = ["book_id", "book_intro"],
)

पैरामीटर	विवरण
`expr`	गुणों को फ़िल्टर करने के लिए उपयोग की जाने वाली बूलियन अभिव्यक्ति। बूलियन अभिव्यक्ति नियमों के बारे में अधिक जानकारी के लिए कृपया बूलियन अभिव्यक्ति नियम पर संदर्भित करें।
`limit`	लौटाने के लिए सबसे ज्यादा समान परिणामों की संख्या। इस मान और `offset` का योग इस मान से कम होना चाहिए जो 16384 है।
`offset`	संग्रह में छोड़ने के लिए परिणामों की संख्या। केवल जब `limit` निर्दिष्ट होता है और इस मान और `limit` का योग इस मान से कम होना चाहिए जो 16384 है। उदाहरण के लिए, यदि आप किसी वेक्टर के 9 वें और 10 वें पास के नजदीकी पड़ोसियों का क्वेरी करना चाहते हैं, तो `limit` को `2` और `offset` को `8` सेट करें।
`output_fields` (वैकल्पिक)	वापसी के फ़ील्ड नामों की सूची।
`partition_names` (वैकल्पिक)	क्वेरी के लिए पार्टीशन नामों की सूची।
`consistency_level` (वैकल्पिक)	क्वेरी के लिए संगर्भ स्तर।

प्राप्त परिणामों की जांच करें।

sorted_res = sorted(res, key=lambda k: k['book_id'])
sorted_res

संख्या एंटिटी

क्वेरी निष्पादित करते समय, आप count(*) को output_fields में जोड़ सकते हैं ताकि Milvus संग्रह में एंटिटी की संख्या लौटा सके। यदि आप विशिष्ट शर्तों को पूरा करने वाली एंटिटियों की संख्या गिनना चाहते हैं, तो expr का उपयोग करें।

संग्रह में सभी एंटिटियों की गणना:

res = collection.query(
  expr="", 
  output_fields = ["count(*)"],
)

print(res)
print(res[0])

निश्चित फ़िल्टरिंग शर्तों को पूरा करने वाली एंटिटियों की संख्या गिनते हैं:

res = collection.query(
  expr="book_id in [2,4,6,8]", 
  output_fields = ["count(*)"],
)

print(res)
print(res[0])

सीमितियां

output_fields में count(*) का उपयोग करते समय, limit पैरामीटर का उपयोग करना प्रतिबंधित है।

शर्त सवाल

संग्रह लोड करें

क्वेरी का निष्पादन

संख्या एंटिटी

सीमितियां

संबंधित शिक्षण