MoneyPrinterTurbo - AI自动生成高清短视频
MoneyPrinterTurbo是一款基于AI大模型的开源软件,旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频 主题或 **关键词** ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。
主要功能 🎯
- 完整的 **MVC架构**,代码 **结构清晰**,易于维护,支持 API 和 Web界面
- 支持视频文案 **AI自动生成**,也可以**自定义文案**
- 支持多种 **高清视频** 尺寸:竖屏 9:16,1080x1920,横屏 16:9,1920x1080
- 支持 **批量视频生成**,可以一次生成多个视频,然后选择一个最满意的
- 支持 **视频片段时长** 设置,方便调节素材切换频率
- 支持 **中文** 和 **英文** 视频文案
- 支持 **多种语音** 合成,可 **实时试听** 效果
- 支持 **字幕生成**,可以调整 字体、位置、颜色、大小,同时支持字幕描边设置
- 支持 **背景音乐**,随机或者指定音乐文件,可设置背景音乐音量
- 视频素材来源 **高清**,而且 **无版权**,也可以使用自己的 **本地素材**
- 支持 **OpenAI**、**Moonshot**、**Azure**、**gpt4free**、**one-api**、**通义千问**、**Google Gemini**、**Ollama**、 **DeepSeek**、 **文心一言** 等多种模型接入
安装使用
配置要求 📦
- 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须
- Windows 10 或 MacOS 11.0 以上系统
快速开始 🚀
下载一键启动包,解压直接使用(路径不要有 **中文**、**特殊字符**、**空格**)
Windows
- 百度网盘(1.2.1 最新版本): 百度网盘 请输入提取码 提取码: g36q
下载后,建议先**双击执行** update.bat 更新到**最新代码**,然后双击 start.bat 启动
启动后,会自动打开浏览器(如果打开是空白,建议换成 **Chrome** 或者 **Edge** 打开)
其他系统
还没有制作一键启动包,看下面的 **安装部署** 部分,建议使用 **docker** 部署,更加方便。
安装部署 📥
前提条件
- 尽量不要使用 **中文路径**,避免出现一些无法预料的问题
- 请确保你的 **网络** 是正常的,VPN需要打开全局流量模式
① 克隆代码
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
② 修改配置文件
- 将 config.example.toml 文件复制一份,命名为 config.toml
- 按照 config.toml 文件中的说明,配置好 pexels_api_keys 和 llm_provider,并根据 llm_provider 对应的服务商,配置相关的 API Key
Docker部署 🐳
① 启动Docker
如果未安装 Docker,请先安装 Docker Desktop: The #1 Containerization Tool for Developers | Docker
如果是Windows系统,请参考微软的文档:
cd MoneyPrinterTurbo
docker-compose up
② 访问Web界面
打开浏览器,访问 http://0.0.0.0:8501
③ 访问API文档
打开浏览器,访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc
手动部署 📦
视频教程
- 完整的使用演示:https://v.douyin.com/iFhnwsKY/
- 如何在Windows上部署:https://v.douyin.com/iFyjoW3M
① 创建虚拟环境
建议使用 conda 创建 python 虚拟环境
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
② 安装好 ImageMagick
-
Windows:
- 下载 ImageMagick – Download 选择Windows版本,切记一定要选择 **静态库** 版本,比如 ImageMagick-7.1.1-32-Q16-x64-**static**.exe
- 安装下载好的 ImageMagick,**注意不要修改安装路径**
- 修改 配置文件 config.toml 中的 imagemagick_path 为你的 **实际安装路径**
-
MacOS:
brew install imagemagick
-
Ubuntu
sudo apt-get install imagemagick
-
CentOS
sudo yum install ImageMagick
③ 启动Web界面 🌐
注意需要到 MoneyPrinterTurbo 项目 根目录 下执行以下命令
Windows
conda activate MoneyPrinterTurbo
webui.bat
MacOS or Linux
conda activate MoneyPrinterTurbo
sh webui.sh
启动后,会自动打开浏览器(如果打开是空白,建议换成 **Chrome** 或者 **Edge** 打开)
④ 启动API服务 🚀
python main.py
启动后,可以查看 API文档 http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口,快速体验。
语音合成 🗣
所有支持的声音列表,可以查看:声音列表
2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。
字幕生成 📜
当前支持2种字幕生成方式:
- **edge**: 生成速度快,性能更好,对电脑配置没有要求,但是质量可能不稳定
- **whisper**: 生成速度慢,性能较差,对电脑配置有一定要求,但是质量更可靠。
可以修改 config.toml 配置文件中的 subtitle_provider 进行切换
建议使用 edge 模式,如果生成的字幕质量不好,再切换到 whisper 模式
注意:
- whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
- 如果留空,表示不生成字幕。
由于国内无法访问 HuggingFace,可以使用以下方法下载 whisper-large-v3 的模型文件
下载地址:
- 百度网盘: 百度网盘 请输入提取码
- 夸克网盘:夸克网盘分享
模型下载后解压,整个目录放到 .\MoneyPrinterTurbo\models 里面, 最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
背景音乐 🎵
用于视频的背景音乐,位于项目的 resource/songs 目录下。
当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。
字幕字体 🅰
用于视频字幕的渲染,位于项目的 resource/fonts 目录下,你也可以放进去自己的字体。
原文地址:https://blog.csdn.net/puterkey/article/details/143829759
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!