Milvus 向量数据库实践 - 1

🕗 发布于 2024-03-08 17:14 milvus

假定你已经安装了docker、docker-compose 环境

参考的文档如下：

Milvus技术探究 - 知乎

MilvusClient() - Pymilvus v2.3.x for Milvus

一文带你入门向量数据库milvus

一、在docker上安装单机模式milvus数据库

1、进入milvus官网： Install Milvus Standalone with Docker Compose Milvus documentation

2、复制并执行以下执行命令：

# 下载docker-compose文件
wget https://github.com/milvus-io/milvus/releases/download/v2.3.10/milvus-standalone-docker-compose.yml -O docker-compose.yml

# 执行docker-compose 
sudo docker compose up -d

3、查看应用是否全部成功启动了：docker ps -a

4、执行docker-compose命令后，可能会出现 milvus-standalone 服务无法正常启动的情况，此时可长时间更改 milvus 的版本后再试试

5、安装 milvus 的可视化操作控制台：Attu


# MILVUS_URL 是 milvus的连接地址，这个不重要，因为在可视化控制台可以修改 
docker run -p 8000:3000 -e MILVUS_URL=127.0.0.1:19530 zilliz/attu:v2.3.0

6、浏览器打开：http://192.168.3.32:8000/

7、预先创建一个collection，方便接下来用代码来测试实际效果

二、使用python 测试图片的向量存储与检索：

注意：实际使用发现使用ResNet50模型更加方便一点，主要是dimension的维度不会特别大，milvus的向量维度最大支持：32768。而使用MobileNetV2模型的话，提取的图片向量特征的dimension为62720。所以为了方便运行代码，体验milvus，直接使用ResNet50模型。

1、直接上代码

import tensorflow as tf  
from PIL import Image  
from tensorflow.keras.applications.resnet50 import ResNet50, preprocess_input  
from tensorflow.keras.preprocessing import image  
import numpy as np  
from pymilvus import MilvusClient
import os  
  
# 初始化Milvus连接  
milvus_client = MilvusClient(uri='http://192.168.3.32:19530')  
  
# 创建一个集合来存储图片向量  
collection_name = 'image_vectors'  
vector_dim = 1000   #向量维度
field_name = 'vec'  #向量字段

# 加载预训练的ResNet50模型  
model = ResNet50(weights='imagenet', include_top=True)

# 提取图片向量
def getFilefeatureVector1(image_path):  
    img = image.load_img(image_path, target_size=(224, 224))  
    img_array = image.img_to_array(img)  
    img_array = np.expand_dims(img_array, axis=0)  
    img_array = preprocess_input(img_array)  
      
    # 使用模型提取特征  
    feature_vector = model.predict(img_array)  
    feature_vector = np.squeeze(feature_vector, axis=0)  
    return feature_vector;

 
# 待测试图片的文件夹目录
image_folder = '/data/files/milvus/'  

# 遍历文件夹下的所有图片，提取特征并存储到Milvus  
def saveFileFeatureVector():
    i=1
    for filename in os.listdir(image_folder):  
        image_path = os.path.join(image_folder, filename)
        print(filename)

        # 获取向量  
        feature_vector=getFilefeatureVector1(image_path)

        print(feature_vector)

        # 将特征向量插入到Milvus集合中  
        insert_data = [{'id':i,'fileName':filename,field_name: feature_vector.tolist()}]  
        milvus_client.insert(collection_name, insert_data)  
        i=i+1


# 用特定图片的向量特征从milvus中查询相似的图片
def searchFile():
    # 取测试一张测试图片，获取到其向量特征后，作为查询条件
    image_path = os.path.join(image_folder, "IMG_20210716_212727_edit_1565328531531.jpg")
    # 获取向量  
    feature_vector=getFilefeatureVector1(image_path)
    search_params = {"metric_type": "L2", "params": {"nprobe": 10}}

    results=milvus_client.search(
        collection_name=collection_name, 
        data = [feature_vector],
        limit=6, # 查询6条
        offset=0, # 当该参数不为空的时候，为分页查询，配合limit使用，下标从0开始
        output_fields=["fileName"],
        search_params= search_params
    )

    for hits in results:
        # get the IDs of all returned hits
        # print(hits)

        for hit in hits:
            # get the value of an output field specified in the search request.
            # dynamic fields are supported, but vector fields are not supported yet.    
            print(hit)
        
  
    
#
print('开始打印')

# 第一步，保存图片向量数据到milvus中（数据初始化成功后，可以注释掉该方法）
saveFileFeatureVector()

# 第二步，用指定图片的向量特征查询相似图片
searchFile()

# 关闭Milvus连接  
milvus_client.close()

2、saveFileFeatureVector 保存图片特征没有保存的时候，我们可以直接在Attu控制台查看数据集

3、用使用指定特图片来查询与其相似的图片执行结果

4、本地电脑待测试图片的文件目录

原文地址：https://blog.csdn.net/cn_yaojin/article/details/136505001

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：mysql下载教程
下一篇：Unity零基础到进阶 | Unity中屏蔽指定UI点击事件的多种方法整理

Linux便捷查询使用手册第十二章：虚拟化与容器
虚拟化是指在单一硬件平台上运行多个虚拟计算机（虚拟机），每个虚拟机可以运行不同的操作系统和应用程序。虚拟化通过抽象物理硬件资源，使其能够在多个虚拟环境中共享。容器是轻量级的虚拟化技术，通过将应用及其依
阅读更多2024-11-16
Javaweb-day11案例（文件）
文件上传前端页面三要素1.在form表单中，要定义一个表单项，类型为file2.表单的提交方式必须得是POST方式下面是讲义里面的内容补充上传文件的原始form表单，要求表单必须具备以下三点（上传文件
阅读更多2024-11-16
深入理解 Linux top命令：用法详解与使用示例
linux topu命令界面各项介绍和一些组合命令介绍。
阅读更多2024-11-16
二叉树Golang
二叉树，深度优先搜索，广度优先搜索
阅读更多2024-11-16
Linux篇（权限管理命令）
在多用户计算机系统的管理中，权限是指某个特定的用户具有特定的系统资源使用权利在Linux 中分别有读、写、执行权限：权限针对文件权限针对目录读r表示可以查看文件内容；cat表示可以(ls)查看目录中存
阅读更多2024-11-16
【代码随想录day30】【C++复健】452. 用最少数量的箭引爆气球；435. 无重叠区间；763. 划分字母区间
而这也这是我想复杂的地方。
阅读更多2024-11-16
mysql存储过程模拟数据批量生成的函数模板
下面是个模板，需要自己。
阅读更多2024-11-16
使用 PyAnsys 在 Ansys 随机振动分析中检索螺栓连接中的力和应力
随机振动模拟通常用于评估组件承受运输过程中振动的能力。随机振动分析利用先前模态分析的频率和模式内容对通过功率谱密度 (PSD) 负载定义的频谱和功率内容进行线性叠加。在大多数装配模型中，螺栓连接（由求
阅读更多2024-11-16
C语言之MakeFile
定义: 变量名=变量值使用:取值;${变量名}或$(变量名)拼接:变量名+=值注意:1,makefile变量名可以以数字开头2,变量的大小是敏感的3,变量一般都在makefile的头部定义4,变量几乎
阅读更多2024-11-16
动态规划 —— 子数组系列-最大子数组和
53. 最大子数组和 - 力扣（LeetCode）
阅读更多2024-11-16

Milvus 向量数据库实践 - 1

相关文章