自学内容网 自学内容网

MoneyPrinterTurbo - AI自动生成高清短视频

MoneyPrinterTurbo是一款基于AI大模型的开源软件,旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频 主题或 **关键词** ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。

主要功能 🎯

  • 完整的 **MVC架构**,代码 **结构清晰**,易于维护,支持 API​ 和 Web界面​
  • 支持视频文案 **AI自动生成**,也可以**自定义文案**
  • 支持多种 **高清视频** 尺寸:竖屏 9:16,1080x1920​,横屏 16:9,1920x1080​
  • 支持 **批量视频生成**,可以一次生成多个视频,然后选择一个最满意的
  • 支持 **视频片段时长** 设置,方便调节素材切换频率
  • 支持 **中文** 和 **英文** 视频文案
  • 支持 **多种语音** 合成,可 **实时试听** 效果
  • 支持 **字幕生成**,可以调整 字体​、位置​、颜色​、大小​,同时支持字幕描边​设置
  • 支持 **背景音乐**,随机或者指定音乐文件,可设置背景音乐音量​
  • 视频素材来源 **高清**,而且 **无版权**,也可以使用自己的 **本地素材**
  • 支持 **OpenAI**、**Moonshot**、**Azure**、**gpt4free**、**one-api**、**通义千问**、**Google Gemini**、**Ollama**、 **DeepSeek**、 **文心一言** 等多种模型接入

安装使用

配置要求 📦
  • 建议最低 CPU 4核或以上,内存 8G 或以上,显卡非必须
  • Windows 10 或 MacOS 11.0 以上系统
快速开始 🚀

下载一键启动包,解压直接使用(路径不要有 **中文**、**特殊字符**、**空格**)

Windows

下载后,建议先**双击执行** update.bat​ 更新到**最新代码**,然后双击 start.bat​ 启动

启动后,会自动打开浏览器(如果打开是空白,建议换成 **Chrome** 或者 **Edge** 打开)

其他系统

还没有制作一键启动包,看下面的 **安装部署** 部分,建议使用 **docker** 部署,更加方便。

安装部署 📥
前提条件
  • 尽量不要使用 **中文路径**,避免出现一些无法预料的问题
  • 请确保你的 **网络** 是正常的,VPN需要打开全局流量​模式
① 克隆代码
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
② 修改配置文件
  • 将 config.example.toml​ 文件复制一份,命名为 config.toml​
  • 按照 config.toml​ 文件中的说明,配置好 pexels_api_keys​ 和 llm_provider​,并根据 llm_provider 对应的服务商,配置相关的 API Key
Docker部署 🐳
① 启动Docker

如果未安装 Docker,请先安装 Docker Desktop: The #1 Containerization Tool for Developers | Docker

如果是Windows系统,请参考微软的文档:

  1. 安装 WSL | Microsoft Learn
  2. WSL 上的 Docker 容器入门 | Microsoft Learn
cd MoneyPrinterTurbo
docker-compose up
② 访问Web界面

打开浏览器,访问 http://0.0.0.0:8501

③ 访问API文档

打开浏览器,访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc

手动部署 📦

视频教程

① 创建虚拟环境

建议使用 conda 创建 python 虚拟环境

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
② 安装好 ImageMagick
  • Windows:

    • 下载 ImageMagick – Download 选择Windows版本,切记一定要选择 **静态库** 版本,比如 ImageMagick-7.1.1-32-Q16-x64-**static**.exe
    • 安装下载好的 ImageMagick,**注意不要修改安装路径**
    • 修改 配置文件 config.toml​ 中的 imagemagick_path​ 为你的 **实际安装路径**
  • MacOS:

    brew install imagemagick
    
  • Ubuntu

    sudo apt-get install imagemagick
    
  • CentOS

    sudo yum install ImageMagick
    
③ 启动Web界面 🌐

注意需要到 MoneyPrinterTurbo 项目 根目录​ 下执行以下命令

Windows

conda activate MoneyPrinterTurbo
webui.bat

MacOS or Linux

conda activate MoneyPrinterTurbo
sh webui.sh

启动后,会自动打开浏览器(如果打开是空白,建议换成 **Chrome** 或者 **Edge** 打开)

④ 启动API服务 🚀
python main.py

启动后,可以查看 API文档​ http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口,快速体验。

语音合成 🗣

所有支持的声音列表,可以查看:声音列表

2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。

字幕生成 📜

当前支持2种字幕生成方式:

  • **edge**: 生成速度快​,性能更好,对电脑配置没有要求,但是质量可能不稳定
  • **whisper**: 生成速度慢​,性能较差,对电脑配置有一定要求,但是质量更可靠​。

可以修改 config.toml​ 配置文件中的 subtitle_provider​ 进行切换

建议使用 edge​ 模式,如果生成的字幕质量不好,再切换到 whisper​ 模式

注意:

  1. whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
  2. 如果留空,表示不生成字幕。

由于国内无法访问 HuggingFace,可以使用以下方法下载 whisper-large-v3​ 的模型文件

下载地址:

模型下载后解压,整个目录放到 .\MoneyPrinterTurbo\models​ 里面, 最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3​

MoneyPrinterTurbo  
  ├─models
  │   └─whisper-large-v3
  │          config.json
  │          model.bin
  │          preprocessor_config.json
  │          tokenizer.json
  │          vocabulary.json
背景音乐 🎵

用于视频的背景音乐,位于项目的 resource/songs​ 目录下。

当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。

字幕字体 🅰

用于视频字幕的渲染,位于项目的 resource/fonts​ 目录下,你也可以放进去自己的字体。


原文地址:https://blog.csdn.net/puterkey/article/details/143829759

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!