使用LMDeploy部署InternVL2，速度测试

🕗 发布于 2024-10-12 10:35 深度学习

这个博客内容详细介绍了基于 InternVL2-40B 模型的多模态API服务的构建和使用，以下是主要内容的概述：

项目概述

该项目的目标是构建一个多模态API服务，使用 InternVL2-40B 模型，通过API接口接收图像和文本输入，并生成相应的描述性文本输出。服务运行在Docker环境中，并使用lmdeploy库进行模型的部署。

环境准备

相关资源链接: 提供了多个链接，包括模型的Hugging Face页面、lmdeploy文档、Dockerfile的GitHub链接和所有InternVL2模型的集合。

Docker镜像构建

详细说明了如何使用Dockerfile构建环境，其中包括CUDA及其依赖库的配置。提供了具体的Docker构建命令。

服务启动

启动容器: 介绍了如何使用特定命令启动Docker容器，并配置GPU支持和文件共享。
启动API服务: 介绍了如何启动API服务，并指定相应的参数和模型格式。

原文地址：https://blog.csdn.net/x1131230123/article/details/142867721

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：组合式API与传统对比
下一篇：《Linux服务与安全管理》| 服务进程与网络配置

一文了解如何应对生成式AI和大模型应用带来的存储挑战
技术的发展正在推动着存储技术的变革，随着QLC、CXL和HBM等先进技术的不断突破和发展，生成式AI和大模型应用面临的存储墙问题将迎刃而解！生成式AI和各种大模型应用，对算力提出了更高的要求，CPU+
阅读更多2024-10-15
Excel：vba实现合并工作簿中的表
A、B、C这三个工作簿的数据都在sheet1，表头一样。
阅读更多2024-10-15
增强对象智能：谷歌开源的XR-Objects项目简介
根据用途的不同，整个系统被划分为四大主要类别：信息查询、对比分析、内容分享以及注释添加。每个类别之下又有多种具体的功能可供选择。总之，通过结合最新的计算机视觉技术和人工智能算法，谷歌成功打造出了一个极
阅读更多2024-10-15
MambaVision原理和源码调测
后面可以看到代码实现也是按照N/2写的。
阅读更多2024-10-15
Bluetooth Channel Sounding中关于CS Step及Phase Based Ranging相应Mode介绍
支持BLE CS的设备，必须要支持此模式，主要用于测量获得BLE CS双方的存在频率偏差。具体来说，是BLS CS中的initiator设备用此模式获得reflector设备与自身的频率偏差。获得该频
阅读更多2024-10-15
速卖通商品详情接口技术解析及Python代码示例
速卖通（AliExpress）作为全球知名的跨境电商平台，其开放平台提供了丰富的API接口，允许开发者集成速卖通的各项功能，实现商品搜索、详情查询、订单管理等一系列操作。本文将重点介绍如何使用速卖通商
阅读更多2024-10-15
【Kubernets】容器网络基础二：通讲CNI（Container Network Interface）容器网络接口实现方案
Macvlan和Ipvlan都是强大的 Linux 内核特性，能够为容器和虚拟机提供高效的网络连接。选择哪种技术取决于具体的网络需求和应用场景。如果你需要每个虚拟网络接口有独立的 MAC 地址，可以选
阅读更多2024-10-15
数据结构：双向带头链表
双向带头链表简易代码
阅读更多2024-10-15
Spring webflux
WebFlux的确通过线程池和多路复用的方式来处理请求，避免了传统每个请求都创建新线程的做法。虽然维护的线程数量是固定的，但由于采用了非阻塞和异步事件驱动的机制，线程并不会因为等待 I/O 而被阻塞，
阅读更多2024-10-15
Python 中 NameError 全局名称未定义
NameError: name 'x' is not defined 是 Python 中常见的错误之一，通常表示你尝试访问一个尚未定义的变量或函数。特别是全局名称未定义时，意味着你在使用某个
阅读更多2024-10-15

使用LMDeploy部署InternVL2，速度测试

项目概述

环境准备

Docker镜像构建

服务启动

相关文章