MoneyPrinterTurbo - AI自动生成高清短视频

🕗 发布于 2024-11-18 18:59 人工智能

MoneyPrinterTurbo是一款基于AI大模型的开源软件，旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频主题或 **关键词** ，就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐，然后合成一个高清的短视频。

主要功能 🎯

完整的 **MVC架构**，代码 **结构清晰**，易于维护，支持 API 和 Web界面
支持视频文案 **AI自动生成**，也可以**自定义文案**
支持多种 **高清视频** 尺寸：竖屏 9:16，1080x1920，横屏 16:9，1920x1080
支持 **批量视频生成**，可以一次生成多个视频，然后选择一个最满意的
支持 **视频片段时长** 设置，方便调节素材切换频率
支持 **中文** 和 **英文** 视频文案
支持 **多种语音** 合成，可 **实时试听** 效果
支持 **字幕生成**，可以调整字体、位置、颜色、大小，同时支持字幕描边设置
支持 **背景音乐**，随机或者指定音乐文件，可设置背景音乐音量
视频素材来源 **高清**，而且 **无版权**，也可以使用自己的 **本地素材**
支持 **OpenAI**、**Moonshot**、**Azure**、**gpt4free**、**one-api**、**通义千问**、**Google Gemini**、**Ollama**、 **DeepSeek**、 **文心一言** 等多种模型接入

安装使用

配置要求 📦

建议最低 CPU 4核或以上，内存 8G 或以上，显卡非必须
Windows 10 或 MacOS 11.0 以上系统

快速开始 🚀

下载一键启动包，解压直接使用（路径不要有 **中文**、**特殊字符**、**空格**）

Windows

百度网盘（1.2.1 最新版本）: 百度网盘请输入提取码提取码: g36q

下载后，建议先**双击执行** update.bat 更新到**最新代码**，然后双击 start.bat 启动

启动后，会自动打开浏览器（如果打开是空白，建议换成 **Chrome** 或者 **Edge** 打开）

其他系统

还没有制作一键启动包，看下面的 **安装部署** 部分，建议使用 **docker** 部署，更加方便。

安装部署 📥

前提条件

尽量不要使用 **中文路径**，避免出现一些无法预料的问题
请确保你的 **网络** 是正常的，VPN需要打开全局流量模式

① 克隆代码

git clone https://github.com/harry0703/MoneyPrinterTurbo.git

② 修改配置文件

将 config.example.toml 文件复制一份，命名为 config.toml
按照 config.toml 文件中的说明，配置好 pexels_api_keys 和 llm_provider，并根据 llm_provider 对应的服务商，配置相关的 API Key

Docker部署 🐳

① 启动Docker

如果未安装 Docker，请先安装 Docker Desktop: The #1 Containerization Tool for Developers | Docker

如果是Windows系统，请参考微软的文档：

cd MoneyPrinterTurbo
docker-compose up

② 访问Web界面

打开浏览器，访问 http://0.0.0.0:8501

③ 访问API文档

打开浏览器，访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc

手动部署 📦

视频教程

完整的使用演示：https://v.douyin.com/iFhnwsKY/
如何在Windows上部署：https://v.douyin.com/iFyjoW3M

① 创建虚拟环境

建议使用 conda 创建 python 虚拟环境

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt

② 安装好 ImageMagick

Windows:
- 下载 ImageMagick – Download 选择Windows版本，切记一定要选择 **静态库** 版本，比如 ImageMagick-7.1.1-32-Q16-x64-**static**.exe
- 安装下载好的 ImageMagick，**注意不要修改安装路径**
- 修改配置文件 config.toml 中的 imagemagick_path 为你的 **实际安装路径**
MacOS:
```
brew install imagemagick
```
Ubuntu
```
sudo apt-get install imagemagick
```
CentOS
```
sudo yum install ImageMagick
```

③ 启动Web界面 🌐

注意需要到 MoneyPrinterTurbo 项目根目录下执行以下命令

Windows

conda activate MoneyPrinterTurbo
webui.bat

MacOS or Linux

conda activate MoneyPrinterTurbo
sh webui.sh

启动后，会自动打开浏览器（如果打开是空白，建议换成 **Chrome** 或者 **Edge** 打开）

④ 启动API服务 🚀

python main.py

启动后，可以查看 API文档 http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口，快速体验。

语音合成 🗣

所有支持的声音列表，可以查看：声音列表

2024-04-16 v1.1.2 新增了9种Azure的语音合成声音，需要配置API KEY，该声音合成的更加真实。

字幕生成 📜

当前支持2种字幕生成方式：

**edge**: 生成速度快，性能更好，对电脑配置没有要求，但是质量可能不稳定
**whisper**: 生成速度慢，性能较差，对电脑配置有一定要求，但是质量更可靠。

可以修改 config.toml 配置文件中的 subtitle_provider 进行切换

建议使用 edge 模式，如果生成的字幕质量不好，再切换到 whisper 模式

注意：

whisper 模式下需要到 HuggingFace 下载一个模型文件，大约 3GB 左右，请确保网络通畅
如果留空，表示不生成字幕。

由于国内无法访问 HuggingFace，可以使用以下方法下载 whisper-large-v3 的模型文件

下载地址：

百度网盘: 百度网盘请输入提取码
夸克网盘：夸克网盘分享

模型下载后解压，整个目录放到 .\MoneyPrinterTurbo\models 里面，最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3

MoneyPrinterTurbo  
  ├─models
  │   └─whisper-large-v3
  │          config.json
  │          model.bin
  │          preprocessor_config.json
  │          tokenizer.json
  │          vocabulary.json

背景音乐 🎵

用于视频的背景音乐，位于项目的 resource/songs 目录下。

当前项目里面放了一些默认的音乐，来自于 YouTube 视频，如有侵权，请删除。

字幕字体 🅰

用于视频字幕的渲染，位于项目的 resource/fonts 目录下，你也可以放进去自己的字体。

原文地址：https://blog.csdn.net/puterkey/article/details/143829759

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：react 中 useReducer Hook 作用
下一篇：跨平台WPF框架Avalonia教程五

在Google Cloud Platform (GCP) 中用Pub/Sub+Dataflow+BigQuery构建数据处理仓库
Pub/Sub：作为消息队列，Pub/Sub 用于接收和传输实时数据流。它能够处理高吞吐量的消息，并将数据分发到多个订阅者。Dataflow：用于数据处理和转换。Dataflow 支持流式和批处理，可
阅读更多2024-11-18
【备忘录】Gin框架
Gin是一个轻量级、高性能的Go语言Web框架，其设计灵感来源于Martini，但相较于Martini，其性能提升了约40倍。Gin基于HTTP路由构建，并提供了丰富的中间件支持，非常适合用于构建高并
阅读更多2024-11-18
系统编译问题
cd “PWD/BUILDE。
阅读更多2024-11-18
C++: string(二)
1 我们这章学习了string的成员函数，在https://legacy.cplusplus.com/网站中可以把接口分为按不同标准分成好多类(如下面Capacity,Element access)，
阅读更多2024-11-18
机器学习基础05_随机森林&线性回归
机器学习；随机森林；线性回归；最小二乘法
阅读更多2024-11-18
AIGC中的图像生成：基于GAN的实现
接下来，我们定义生成器和判别器的网络结构。# 生成器nn.ReLU(),nn.ReLU(),nn.ReLU(),nn.Linear(1024, 28 * 28), # MNIST图像大小nn.Tanh
阅读更多2024-11-18
MYSQL 修改表的结构
在项目的实际开发中，随着版本的迭代和需求的变更，经常会对表结构进行调整，比如向现有表中添加列，删除列，或者修改某列的列名、数据类型或长度，这时就需要对表进行修改操作。RENAME [TO | AS]
阅读更多2024-11-18
基于YOLOv8深度学习的智慧农业野生蓝莓成熟度小目标检测系统研究与实现(PyQt5界面+数据集+训练代码)
随着智慧农业技术的不断进步，传统农业逐渐向自动化、智能化转型，特别是在果实成熟度检测领域，精确、及时的检测手段已成为提升农业生产效率和优化资源配置的重要工具。
阅读更多2024-11-18
Linux防火墙
表是用于网络地址转换（Network Address Translation，NAT）的表之一，用于修改数据包的源 IP 地址、目标 IP 地址或端口号，以实现网络地址的映射和转换。iptables
阅读更多2024-11-18
LeetCode39：组合总和
这个代码其实就是和前面的组合总是是一样的，但是呢，主要一点是，这个for循环里面的backtracking的不是i + 1了，而是i,因为当前i可以去取当前的元素，而i + 1是不能去当前的元素的。
阅读更多2024-11-18

MoneyPrinterTurbo - AI自动生成高清短视频

​

​

主要功能 🎯

安装使用

配置要求 📦

快速开始 🚀

Windows

其他系统

安装部署 📥

前提条件

① 克隆代码

② 修改配置文件

Docker部署 🐳

① 启动Docker

② 访问Web界面

③ 访问API文档

手动部署 📦

① 创建虚拟环境

② 安装好 ImageMagick

③ 启动Web界面 🌐

④ 启动API服务 🚀

语音合成 🗣

字幕生成 📜

背景音乐 🎵

字幕字体 🅰

相关文章