使用 vllm 部署 MiniCPM-o 2.6

🕗 发布于 2025-01-22 02:43 vllm MiniCPM-o 2.6

使用 vllm 部署MiniCPM-o 2.6

1. 创建虚拟环境
2. 克隆代码
3. 从代码安装 vllm
4. 安装 flash-attn
5. 启动 MiniCPM-o 2.6
6. 使用 chatbox 客户端访问并测试一下

1. 创建虚拟环境

conda create -n vllm_openbmb python=3.11 -y
conda activate vllm_openbmb

2. 克隆代码

git clone https://github.com/OpenBMB/vllm.git
cd vllm
git checkout minicpmo

3. 从代码安装 vllm

VLLM_USE_PRECOMPILED=1 pip install --editable .

4. 安装 flash-attn

pip install flash-attn --no-build-isolation

5. 启动 MiniCPM-o 2.6

CUDA_VISIBLE_DEVICES=3,1,0,2 \
VLLM_WORKER_MULTIPROC_METHOD=spawn \ 
vllm serve openbmb/MiniCPM-o-2_6 --trust-remote-code --served-model-name gpt-4 --gpu-memory-utilization 0.98 --tensor-parallel-size 4 --port 8000 --api-key sk-123456

6. 使用 chatbox 客户端访问并测试一下

在这里插入图片描述

参考资料：

https://github.com/OpenBMB/MiniCPM-o?tab=readme-ov-file#efficient-inference-with-llamacpp-ollama-vllm

原文地址：https://blog.csdn.net/engchina/article/details/145259261

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：使用 Java 获取淘宝推荐商品列表 API 接口的示例代码解析
下一篇：电气防火保护器为高校学生宿舍提供安全保障

ubuntu24.04安装mysql 5.7.44版本
使用下面命令，查看配置信息是否，这一步非常重要，配置文件不生效，会导致系统区分大小写表。创建该文件，退出的时候，就算不输入内容，也要强制保存一下 :wq!命令来更新init系统，以便在系统启动时自动启
阅读更多2025-01-22
SQLmap 自动注入 -02
SQLmap 是SQL注入的超级工具，这次参数是 -dbs, 还要-users, --current-user
阅读更多2025-01-22
AI大模型-提示工程学习笔记12-检索增强生成(RAG)
是一种结合检索（Retrieval）和生成（Generation）的技术，旨在通过从外部知识库中检索相关信息，增强大语言模型（LLM）的生成能力。尽管 RAG 面临一些挑战（如检索质量、知识库维护成本
阅读更多2025-01-22
在亚马逊云科技上用AI提示词优化功能写出漂亮提示词（下）
提示工程（Prompt Engineering）对各位小伙伴们来说是再熟悉不过了，提示词工程技术是通过编写指令词，指导开发者们调用AI基础模型（FMs）获得期望的响应。但是经常写提示词的朋友们会知道，
阅读更多2025-01-22
他把智能科技引入现代农业领域
江苏田倍丰农业科技有限公司（以下简称“田倍丰”）是一家专注于粮油种植的农业科技公司，为拥有300亩以上田地的大户提供全面的解决方案。田倍丰通过与当地政府合作，将土地承包给大户，并提供农资和技术，实现利
阅读更多2025-01-22
深圳市云盟智慧科技有限公司智慧停车管理系统 SQL注入漏洞复现（附脚本）
深圳市云盟智慧科技有限公司智慧停车管理系统 /GetVideo 接口存在SQL注入漏洞，未经身份验证的恶意攻击者利用 SQL 注入漏洞获取数据库中的信息（例如管理员后台密码、站点用户个人信息）之外，攻
阅读更多2025-01-22
江天科技主要产品销售单价下滑，应收账款、存货周转率大幅下降
报告期各期，公司薄膜类不干胶标签实现营收分别为2.37亿、2.75亿、3.90亿、2.21亿，营收占比分别为68.20%、71.69%、76.77%、79.23%；此外，报告期各期，江天科技毛利率分别
阅读更多2025-01-22
PAT乙级真题 — 1060 爱丁顿数（java）
英国天文学家爱丁顿很喜欢骑车。据说他为了炫耀自己的骑车功力，还定义了一个“爱丁顿数” E ，即满足有 E 天骑车超过 E 英里的最大整数 E。据说爱丁顿自己的 E 等于87。现给定某人 N 天的骑车距
阅读更多2025-01-22
AutoSAR CP RTE 规范核心内容简介以及BswScheduler工作原理解析
本规范详细介绍了AUTOSAR运行时环境（RTE）和基本软件调度器（BswScheduler）的软件规范。RTE概述：AUTOSAR概念：RTE生成过程：RTE功能规范：RTE与基本软件调度器的交互：
阅读更多2025-01-22
UE5 开启“Python Remote Execution“
在启用 Unreal Engine 5（UE5）的“Python 远程执行”功能后，UE5 会启动一个 UDP 组播套接字服务，以监听来自外部应用程序的 Python 命令。通过这种方式，UE5 实现
阅读更多2025-01-22

使用 vllm 部署 MiniCPM-o 2.6

使用 vllm 部署MiniCPM-o 2.6

1. 创建虚拟环境

2. 克隆代码

3. 从代码安装 vllm

4. 安装 flash-attn

5. 启动 MiniCPM-o 2.6

6. 使用 chatbox 客户端访问并测试一下

相关文章