如何在算家云搭建EchoMimic（数字人）

🕗 发布于 2024-10-16 21:06 算家云 EchoMimic 数字人大模型搭建 AIGC

一、模型介绍

EchoMimic 是一个由阿里巴巴蚂蚁集团开发的开源 AI 数字人项目，通过可编辑地标调节实现逼真的音频驱动肖像动画，它能够将静态图像转化为具有动态语音和表情的数字人像。

二、模型搭建流程

1.大模型 Video-Infinity 一键使用

基础环境最低要求说明：

环境名称	版本信息1
Ubuntu	22.04.4 LTS
Cuda	V12.1.105
Python	3.8.19
NVIDIA Corporation	RTX 3090
模型大小	超过 60 G，需要数据盘扩容

根据需求选择主机和镜像，一键创建实例

在租用实例页面，通过一键使用进入应用社区

搜索并选择 EchoMimic 大模型

选择 RTX 3090 GPU，进行创建实例

2. 进入网页端命令行

在项目实例页面，点击 WebSSH

进入 WebSSH 页面，运行后续的功能代码

3. 下载模型文件

# 复制项目到数据盘（因为模型有点大）
cp -r EchoMimic/ /root/sj-tmp/
# 进入项目
cd /root/sj-tmp/EchoMimic
# 下载模型
git lfs install
git clone https://hf-mirror.com/BadToBest/EchoMimic pretrained_weights

模型下载完成的截图：

4. 启动 webgui.py 文件

# 切换到项目工作目录
cd /root/sj-tmp/EchoMimic

# 激活 echomimic 虚拟环境
conda activate echomimic

# 运行 webgui.py 文件
python -u webgui.py --server_port=8080

5. 获取端口号

第一次使用需要进行实名认证（通过实名认证可跳过此步骤）

实名认证之后进行开发对外端口

获取访问地址

6. 进入 web 页面

将获取到的链接复制到本地浏览器：

# 比如当前获取的地址如下：
http://hn-a.suanjiayun.com:30758

以上就是在算家云搭建EchoMimic的流程，具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击应用社区（www.suanjiayun.com/mirror），选择模型，一键开启 AI 之旅！

原文地址：https://blog.csdn.net/SJJS_1/article/details/142943170

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Vision China 2024 | 移远通信以一体化的AI训练及部署能力，引领3C电子制造智能升级
下一篇：git的下载安装完整教程

HCIP——以太网交换安全（四）&DHCP Snooping
以太网交换安全-DHCP Snooping
阅读更多2024-10-17
【Flutter】Dart：类
在 Dart 中，**类**（Class）是面向对象编程的核心概念之一，提供了一种封装数据和功能的方式。理解 Dart 中的类以及它的相关特性是开发 Flutter 应用的基础。本教程将深入介绍 Da
阅读更多2024-10-17
vae与ae的区别
为了更好地理解变分自编码器（VAE）和自编码器（AE）的区别，让我们通过一个具体的例子来说明。假设我们正在处理一个手写数字图像数据集，如 MNIST。
阅读更多2024-10-17
自动驾驶系列—自动驾驶系统监控平台：保障无人驾驶安全的幕后英雄
随着自动驾驶技术的发展，车辆不再依赖人类驾驶员操作，而是通过感知、决策和控制系统来实现自动驾驶。这一复杂的技术体系需要高度的实时监控，以确保车辆能够在各种环境中稳定、安全地运行。因此，自动驾驶系统监控
阅读更多2024-10-17
第六章元素应用CSS
CSS 提供属性来控制文本的字体类型。参数：字体名称按优先顺序排列，以逗号隔开。如果字体名称包含空格，则应用引号括起。说明：用 font-family 属性可控制显示字体。不同的操作系统，其字体名是不
阅读更多2024-10-17
PreCT-160K数据集：包含160K个CT体积的大规模医学图像预训练数据集，覆盖了100多种解剖结构。迄今为止最大规模的医学图像预训练数据集
2024-10-08，由香港科技大学的计算机科学与工程系创建了PreCT-160K，这是迄今为止最大规模的医学图像预训练数据集。该数据集包含了160K个CT体积，覆盖了100多种解剖结构，对于推动医学
阅读更多2024-10-17
kubekey的应用
KubeKey 是一个开源的轻量级工具，用于部署 Kubernetes 集群。它提供了一种灵活、快速、方便的方式来安装 Kubernetes/K3s、Kubernetes/K3s 和 KubeSphe
阅读更多2024-10-17
全面解析文档对象模型（DOM）及其操作(DOM的概念与结构、操作DOM节点、描述DOM树的形成过程、用DOMParser解析字符串为DOM对象）
文档对象模型（DOM）是Web开发中的核心概念，它提供了一种结构化的方法来表示和操作HTML和XML文档。通过DOM，开发者可以动态地访问和更新文档的内容、结构和样式。本文将深入探讨DOM的概念与结构
阅读更多2024-10-17
吴恩达深度学习笔记：卷积神经网络（Foundations of Convolutional Neural Networks）3.7-3.8
到目前为止你们学到的对象检测中的一个问题是，你的算法可能对同一个对象做出多次检测，所以算法不是对某个对象检测出一次，而是检测出多次。非极大值抑制这个方法可以确保你的算法对每个对象只检测一次，我们讲一个
阅读更多2024-10-17
leetcode——135.分发糖果
135.分发糖果
阅读更多2024-10-17