Эта глава представляет, как быстро начать разработку Milvus с использованием Python.
Запустив предоставленный нами образец кода, вы приобретете предварительное понимание функций Milvus.
Требования к версии
- Milvus 2.3.0
- Python 3 (3.7.1 или выше)
- PyMilvus 2.3.x
Установка Milvus Python SDK
python3 -m pip install pymilvus==
Загрузка образца кода
Используйте следующую команду для прямого скачивания hello_milvus.py или используйте следующую команду для загрузки.
$ wget https://www.tizi365.com/storage/hello_milvus.py
Разъяснение образца кода
Образец кода выполняет следующие шаги.
- Импортировать пакет PyMilvus:
from pymilvus import (
connections,
utility,
FieldSchema,
CollectionSchema,
DataType,
Collection,
)
- Подключиться к серверу:
connections.connect("default", host="localhost", port="19530")
- Создать коллекцию:
fields = [
FieldSchema(name="pk", dtype=DataType.INT64, is_primary=True, auto_id=False),
FieldSchema(name="random", dtype=DataType.DOUBLE),
FieldSchema(name="embeddings", dtype=DataType.FLOAT_VECTOR, dim=8)
]
schema = CollectionSchema(fields, "hello_milvus - простейший демонстрационный пример, используемый для представления API")
hello_milvus = Collection("hello_milvus", schema)
- Вставить векторы в коллекцию:
import random
entities = [
[i for i in range(3000)], # поле pk
[float(random.randrange(-20, -10)) for _ in range(3000)], # поле random
[[random.random() for _ in range(8)] for _ in range(3000)], # поле embeddings
]
insert_result = hello_milvus.insert(entities)
hello_milvus.flush()
- Создать индекс на сущностях:
index = {
"index_type": "IVF_FLAT",
"metric_type": "L2",
"params": {"nlist": 128},
}
hello_milvus.create_index("embeddings", index)
- Загрузить коллекцию в память и выполнить поиск похожих векторов:
hello_milvus.load()
vectors_to_search = entities[-1][-2:]
search_params = {
"metric_type": "L2",
"params": {"nprobe": 10},
}
result = hello_milvus.search(vectors_to_search, "embeddings", search_params, limit=3, output_fields=["random"])
- Выполнить запросы к векторам:
result = hello_milvus.query(expr="random > -14", output_fields=["random", "embeddings"])
- Выполнить смешанный поиск:
result = hello_milvus.search(vectors_to_search, "embeddings", search_params, limit=3, expr="random > -12", output_fields=["random"])
- Удалить сущности на основе первичного ключа:
expr = f"pk in [{entities[0][0]}, {entities[0][1]}]"
hello_milvus.delete(expr)
- Удалить коллекцию:
utility.drop_collection("hello_milvus")
Запуск образца кода
Выполните следующую команду, чтобы запустить образец кода.
$ python3 hello_milvus.py
Ниже показаны возвращенные результаты и задержка запроса:
=== Подключение к Milvus ===
Существует ли коллекция с именем hello_milvus в Milvus: False
=== Создание коллекции `hello_milvus` ===
=== Вставка сущностей ===
Количество сущностей в Milvus: 3000
=== Создание индекса IVF_FLAT ===
=== Загрузка ===
=== Поиск на основе векторной схожести ===
Соответствие: (Расстояние: 0.0, ID: 2998), Случайное поле: -11.0
Соответствие: (Расстояние: 0.11455299705266953, ID: 1581), Случайное поле: -18.0
Соответствие: (Расстояние: 0.1232629269361496, ID: 2647), Случайное поле: -13.0
Соответствие: (Расстояние: 0.0, ID: 2999), Случайное поле: -11.0
Соответствие: (Расстояние: 0.10560893267393112, ID: 2430), Случайное поле: -18.0
Соответствие: (Расстояние: 0.13938161730766296, ID: 377), Случайное поле: -14.0
Время выполнения поиска = 0.2796 секунд
=== Запрос с использованием `random > -14` ===
Результат запроса:
-{'pk': 9, 'random': -13.0, 'векторы': [0.298433, 0.931987, 0.949756, 0.598713, 0.290125, 0.094323, 0.064444, 0.306993]}
Задержка поиска = 0.2970 секунд
=== Выполнение смешанного поиска с использованием `random > -12` ===
Соответствие: (Расстояние: 0.0, ID: 2998), Случайное поле: -11.0
Соответствие: (Расстояние: 0.15773043036460876, ID: 472), Случайное поле: -11.0
Соответствие: (Расстояние: 0.3273330628871918, ID: 2146), Случайное поле: -11.0
Соответствие: (Расстояние: 0.0, ID: 2999), Случайное поле: -11.0
Соответствие: (Расстояние: 0.15844076871871948, ID: 2218), Случайное поле: -11.0
Соответствие: (Расстояние: 0.1622171700000763, ID: 1403), Случайное поле: -11.0
Задержка поиска = 0.3028 секунд
=== Удаление с использованием выражения `pk in [0, 1]` ===
Запрос до удаления на основе выражения `pk in [0, 1]` -> Результат:
-{'pk': 0, 'random': -18.0, 'векторы': [0.142279, 0.414248, 0.378628, 0.971863, 0.535941, 0.107011, 0.207052, 0.98182]}
-{'pk': 1, 'random': -15.0, 'векторы': [0.57512, 0.358512, 0.439131, 0.862369, 0.083284, 0.294493, 0.004961, 0.180082]}
Запрос после удаления на основе выражения `pk in [0, 1]` -> Результат: []
=== Удаление коллекции `hello_milvus` ===