【模型】开源图像模型Stable Diffusion入门手册

🕗 发布于 2024-11-22 14:18 stable diffusion

开源图像模型Stable Diffusion入门手册

引言

Stable Diffusion是一款在2022年发布的深度学习文字到图像生成模型。它能够根据文字描述生成详细的图像，并且在几秒钟内创作出令人惊叹的艺术作品。本文将为你提供一份使用Stable Diffusion的入门教程。

硬件要求

内存: 建议使用不少于16GB的内存。
硬盘空间: 需要60GB以上的空间。
显卡: 推荐使用NVIDIA显卡（CUDA架构），虽然已有对AMD显卡的支持，但速度较慢。

环境部署

手动部署

安装Python: 安装Python 3.10，并确保在安装时选中“Add Python to PATH”。
安装Git: 从git-scm.com下载并安装Git。
克隆仓库:
- 按下Win+R，输入cmd，调出命令行窗口。
- 运行以下命令克隆Stable Diffusion WebUI的GitHub仓库：
```
cd path_to_clone
git clone https://github.com/automatic1111/stable-diffusion-webui.git
```
- 将path_to_clone替换为你希望下载的目录。

整合包

如果你觉得手动部署麻烦，可以使用整合包，解压即用。例如，独立研究员的空间下经常更新整合包，秋叶的启动器也非常好用。

模型装配

下载模型: 在如Civitai上下载标注有ckpt的模型。
放置模型: 将下载的模型放入models/stable-diffusion目录。
运行WebUI: 双击运行webui-user.bat。脚本会自动下载依赖，等待一段时间后，程序会输出一个类似http://127.0.0.1:7860/的地址，在浏览器中输入这个链接即可。

更新

更新仓库:
- 按下Win+R，输入cmd，调出命令行窗口。
- 运行以下命令更新仓库：
```
cd path_to_clone
git pull
```
- 将path_to_clone替换为你下载仓库的目录。

显存优化

根据显卡实际显存选择优化量，不要超过当前显卡显存。建议开启xformers以改善内存消耗和速度。

插件配置

Stable Diffusion可配置大量插件扩展，在WebUI的“扩展”选项卡下，可以安装插件。

文生图最简流程

选择模型: 选择需要使用的模型（底模）。
填写提示词: 在第一个框中填入提示词（prompt），对想要生成的东西进行文字描述。
填写负面提示词: 在第二个框中填入负面提示词（negative prompt），描述你不想要生成的内容。
选择参数: 选择采样方法、采样次数、图片尺寸等参数。
生成图像: 点击“生成”按钮，等待图像生成。

提示词使用技巧

自然语言: 使用描述物体的句子作为提示词。
单词标签: 使用逗号隔开的单词作为提示词。
Emoji和颜文字: Emoji表情符号也非常准确。
语法: 根据自己想画的内容写出提示词，多个提示词之间使用英文半角符号[ , ]。

结语

Stable Diffusion是一款功能强大的图像生成模型，通过合理的配置和使用，可以创作出高质量的图像作品。

原文地址：https://blog.csdn.net/yuzhangfeng/article/details/143938638

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：获国家权威机构认可亚信安全荣获CNVD技术组支撑单位认证
下一篇：ComfyUI绘画|Stable Diffusion原理的简易讲解

每日OJ_牛客_NC316体育课测验(二)_拓扑排序_C++_Java
每日OJ_牛客_NC316体育课测验(二)_拓扑排序_C++_Java（起始时，将所有入度为 0 的节点进行入队（入度为 0，说明没有边指向这些节点，将它们放到拓扑排序的首部，不会违反拓扑序定义）。从
阅读更多2024-11-25
医院挂号就诊系统（源码+数据库+报告）
基于SpringBoot的医院挂号就诊系统，系统包含三种角色：管理员、医生、用户,系统分为前台和后台两大模块
阅读更多2024-11-25
Vue3 + Pinia：批量修改数据的终极指南
Hey小伙伴们！今天我们要聊的是Vue3中一个非常强大的状态管理库——Pinia。Pinia不仅简化了状态管理的复杂度，还提供了丰富的功能，让你在存储和批量修改数据时更加得心应手。让我们一起来看看如何
阅读更多2024-11-25
Dubbo Golang快速开发Rpc服务
Dubbo Golang快速开发Rpc服务
阅读更多2024-11-25
Superset 二次开发之Superset技术栈分析
Apache Superset 是一个功能强大的开源数据可视化平台，支持交互式仪表板和数据探索。它的灵活性来源于其现代化的技术栈架构。本文将详细分析 Superset 的技术栈，从前端到后端及数据层，
阅读更多2024-11-25
移动充储机器人“小奥”的多场景应用（上）
在高速公路服务区，新能源汽车的充电需求得到“小奥”机器人的及时响应。得益于“小奥”的机动性，其服务策略可根据服务区的实时车流状况进行动态调整：在车流量高峰时段增加充电频次，而在车流量低谷时段则优化充电
阅读更多2024-11-25
装饰器模式 (Decorator Pattern)
/ 抽象组件// 获取描述// 获取价格装饰器模式是一种灵活的设计模式，可以在运行时动态地为对象添加功能。它有效避免了类爆炸问题，特别适合需要灵活组合的场景。通过对象组合，装饰器模式实现了强大的扩展能
阅读更多2024-11-25
LeetCode 第 425 场周赛个人题解
定义 f(u, lim) 为 u 所在子树最大合法化值，lim = true 说明<p, u> 的边被父节点拿掉了，否则没拿掉。f(i, j, k) 为 [i, n - 1] 剩余 j 次
阅读更多2024-11-25
Linux应用编程(C语言编译过程)
此章对GCC编译流程进行学习，包括预处理、编译、汇编等步骤的作用以及命令、命令参数的学习
阅读更多2024-11-25
3D模型平台行业全面深入分析
3D 模型是三维物体的数学表示。 3D 模型用于描绘艺术的真实世界和概念视觉效果，3D 模型被世界各地的游戏开发人员、新闻机构、建筑师、视觉效果工作室、广告商和创意专业人士等使用。
阅读更多2024-11-25

【 模型】 开源图像模型Stable Diffusion入门手册