Ce chapitre présente comment démarrer rapidement avec les opérations de lecture et d'écriture de la base de données de vecteurs Milvus en utilisant Go.
Installation du SDK Go
Remarque : Le SDK Go nécessite la version 1.15 ou supérieure de Go.
go get -u github.com/milvus-io/milvus-sdk-go/v2
Importation des dépendances
import (
"context"
"fmt"
"log"
"math/rand"
"time"
"github.com/milvus-io/milvus-sdk-go/v2/client"
"github.com/milvus-io/milvus-sdk-go/v2/entity"
)
Connexion à la base de données Milvus
ctx := context.Background()
log.Printf(msgFmt, "Connexion à Milvus")
c, err := client.NewClient(ctx, client.Config{
Address: "localhost:19530",
})
if err != nil {
log.Fatal("Échec de la connexion à Milvus, err: ", err.Error())
}
defer c.Close()
Création d'une collection
Le processus de création d'une collection est similaire à la création d'une structure de table MySQL, où vous devez décrire le type de chaque champ.
collectionName = "hello_tizi365"
log.Printf(msgFmt, fmt.Sprintf("Création de la collection, `%s`", collectionName))
// Définir les types de champ de la collection, en définissant ici les champs ID, random et embeddings
schema := entity.NewSchema().WithName(collectionName).WithDescription("Description de la collection").
WithField(entity.NewField().WithName("ID").WithDataType(entity.FieldTypeInt64).WithIsPrimaryKey(true).WithIsAutoID(false)).
WithField(entity.NewField().WithName("random").WithDataType(entity.FieldTypeDouble)).
WithField(entity.NewField().WithName("embeddings").WithDataType(entity.FieldTypeFloatVector).WithDim(dim))
// Créer la collection en fonction des types de champ de collection définis
if err := c.CreateCollection(ctx, schema, entity.DefaultShardNumber); err != nil {
log.Fatalf("Échec de la création de la collection, err: %v", err)
}
Insertion de données dans la collection
idList, randomList := make([]int64, 0, nEntities), make([]float64, 0, nEntities)
embeddingList := make([][]float32, 0, nEntities)
rand.Seed(time.Now().UnixNano())
// À des fins de test, générer certaines données de test aléatoires ici
// Générer des IDs
for i := 0; i < nEntities; i++ {
idList = append(idList, int64(i))
}
// Générer des valeurs aléatoires
for i := 0; i < nEntities; i++ {
randomList = append(randomList, rand.Float64())
}
// Générer des valeurs de vecteur
for i := 0; i < nEntities; i++ {
vec := make([]float32, 0, dim)
for j := 0; j < dim; j++ {
vec = append(vec, rand.Float32())
}
embeddingList = append(embeddingList, vec)
}
// Insérer de multiples ensembles de données, organisés par colonne pour de multiples données
idColData := entity.NewColumnInt64("ID", idList)
randomColData := entity.NewColumnDouble("random", randomList)
embeddingColData := entity.NewColumnFloatVector("embeddings", dim, embeddingList)
// Insérer des données
if _, err := c.Insert(ctx, collectionName, "", idColData, randomColData, embeddingColData); err != nil {
log.Fatalf("Échec de l'écriture des données, err: %v", err)
}
// Vider les données sur le disque
if err := c.Flush(ctx, collectionName, false); err != nil {
log.Fatalf("Échec du vidage des données, err: %v", err)
}
Création d'un index
// Définir le type d'index
idx, err := entity.NewIndexIvfFlat(entity.L2, 128)
if err != nil {
log.Fatalf("Échec de la définition de l'index, err: %v", err)
}
// Créer un index pour la collection spécifiée
if err := c.CreateIndex(ctx, collectionName, embeddingCol, idx, false); err != nil {
log.Fatalf("Échec de la création de l'index, err: %v", err)
}
// Charger la collection spécifiée en mémoire pour améliorer l'efficacité des requêtes
err = c.LoadCollection(ctx, collectionName, false)
if err != nil {
log.Fatalf("Échec du chargement de la collection, err: %v", err)
}
Recherche de similarité de vecteurs
// Préparer les vecteurs à rechercher. Ici, nous extrayons une partie des données vectorielles générées précédemment pour les tests, et nous rechercherons des résultats similaires à ces vecteurs ci-dessous.
vec2search := []entity.Vector{
entity.FloatVector(embeddingList[len(embeddingList)-2]),
entity.FloatVector(embeddingList[len(embeddingList)-1]),
}
begin := time.Now()
sp, _ := entity.NewIndexIvfFlatSearchParam(16)
// Effectuer une recherche de similarité de vecteurs
sRet, err := c.Search(ctx, collectionName, nil, "", []string{"aléatoire"}, vec2search,
"embeddings", entity.L2, topK, sp)
end := time.Now()
if err != nil {
log.Fatalf("La recherche a échoué, err: %v", err)
}
log.Println("Imprimer les résultats:")
for _, res := range sRet {
printResult(&res)
}
Définition de la fonction printResult
func printResult(sRet *client.SearchResult) {
randoms := make([]float64, 0, sRet.ResultCount)
scores := make([]float32, 0, sRet.ResultCount)
var randCol *entity.ColumnDouble
for _, field := range sRet.Fields {
if field.Name() == randomCol {
c, ok := field.(*entity.ColumnDouble)
if ok {
randCol = c
}
}
}
for i := 0; i < sRet.ResultCount; i++ {
val, err := randCol.ValueByIdx(i)
if err != nil {
log.Fatal(err)
}
randoms = append(randoms, val)
scores = append(scores, sRet.Scores[i])
}
log.Printf("\taléatoires: %v, scores: %v\n", randoms, scores)
}
Code source complet de démonstration, Code source de démarrage de Go Milvus