Stable Diffusion Hypernetwork Embedding

🕗 发布于 2024-11-17 20:48 人工智能 stable diffusion ai绘画

本节内容，给大家带来的是stable diffusion的Embedding与HyperNetwork课程。在上节课程中，我们已经了解了关于Lora模型和LyCORIS模型的使用。我们可以通过训练Lora模型与LyCORIS模型来对基础模型进行低资源微调，从而实现具有某一类特征的图像产出。

在stable diffusion中，还提供了另外两种控制图像输出特征和风格的方法---embedding和hypernetwork，本节课程，我们就将演示embedding和hypernetwork会如何影响stable diffusion的图像绘制过程，

一：Embedding

Embedding:字面上的意思是“嵌入”，Embedding也不会改变大模型。他是另外一种训练方法-textual inversion的输出结果。textual inversion是一种轻量化训练方式，训练出来的结果实际上是单词与其对应向量的映射记录，就类似书签那样，可以快速指向某些内容。textual inversion结果是一个非常非常小的数据集，一般只有十几K，他同样需要配合大模型使用。通过训练，Textual Inversion将为关键词找到了一个最合适的参数向量，使用该向量可指导原始的扩散模型输出期待的图像。

这样讲有些抽象，我们用具体的实例来去理解Embeddings会更好。

早前，在进行AI绘画的过程中，会经常遇到一个难题---画手，AI虽然学习了大量的图像数据特征，但是对如何画好人类的手总是力不从心，比如这样的图像。

AI似乎对某些细节的理解还不够深刻。但是人们还是找到了解决这些问题的方法，比如可以通过大量画得不好的手的图像训练出一个数据集，然后告诉stable diffusion，在生成的图像中不要出现这些数据集中的特征。

badhand便是我们经常会使用到的一个Embedding，我们通过将这个Embedding的关键信息加到负面提示词中，这样stable diffusion在绘制新的图像时，便会尽量避开这个Embedding所指示的信息。从而尽可能地画出一幅包含正常手元素的图像。

我们可以在C站上搜索badhand找到这个embedding，

搜索结果中的badhandv4就是我们常用的的embedding，点击进入后，可以看到详细信息，使用方法。

将 badhandv4.pt 文件下载后放置在您 stable diffusion webui程序主目录下的 embeddings 文件夹内。

之后，可以参考文档自行输入触发关键词来引用embedding，也可以点击反向提示词下方的embedding标签页，点击刷新，可以看到安装好的embedding项，

点击对应的项目，将自动添加关键词到输入框，需要注意的是该关键词应该应用到反向提示词输入框，点击生成，生成的图片会尽量避免出现不合适的手元素。

这里补充一下，画手是AI绘画中很重要的一个课题，使用Embeddings并不能完全避免不合适的元素，仍然有比较大的概率会画出不合适的手，我们还需要使用一些其他手段，比如后面课程中会讲述的controlnet，以及前面课程中的Lora，LyCoris模型，局部重绘等来加强手元素的绘制。

常用的embedding除了badhandv4外，还有EasyNegative、deepnegative等

比如EasyNegative是一个集合了负面提示的插件，

我们以往在填写负面提示词时，经常会填入如“低分辨率、模糊、扭曲的五官、错误的手指、多余的数字，水印”等，以避免生成低质量的图像。而EasyNegative这个embedding则是将这些负面的信息资源整合打包，只要将触发词

EasyNegative加入到负面提示词中，就可以在生成的图像中避免生成低质量或不合适的图片。

实践使用中，通常会将多个embeddings应用到stable diffusion的图像绘制过程中，比如我们会使用一些固定的惯例提示语句，这些提示语句中可能会包含一些如bandhandv4，easynegative embedding关键词，我们只需下载好对应的embedding文件，然后使用这些固定的惯例提示语句即可，这样stable diffusion绘制出来的图片就能减少很多意外画崩的情况。

我们上面演示的embeddings都是在负面提示词里使用，也有一些在正面提示词里使用的embedding，比如C站上可以找到一些与特定人物相关的embeddings，这些embeddings的触发词则是放在正面提示词里的。

我们使用过滤器进列出embeddings，并且选择most liked排序，

排在最前的是我们刚刚介绍的一些最常用的embedding，还有一些在正面提示词中使用的embedding，比如Pure Eros Face纯欲风embedding，该embedding可以引导stable diffusion绘制纯欲风的人物图像。

二: Hypernetwork

Hypernetworks是stable diffusion中的另外一种训练方法，通过Hypernetworks训练，可以得到一个新的神经网络模型，该模型能够向原始扩散模型中插入合适的中间层及对应的参数，从而使输出图像与输入关键字指令之间产生期待的关联关系。其生成的模型结构通常都很小，基本都低于200Mb。

我们在C站上使用过滤选项后可以列出可供使用的Hypernetwork。

我们用Chili Style这个hypernetwork做一下演示。

下载后将文件放知道stable diffusion webUI程序主目录model文件下的hypernetwork目录中，

stable diffusion webUI图片绘制页面点击反向提示词下方的hypernetwork标签页，可以看到安装好的embedding项，点击对应的项目，将自动添加引用指令到到输入框，

我们选择合适的模型，增加一些正向提示词：

emoji, simple background, 1girl, solo, full body, white skin, outline, iop, pointy ears, orange hair, medium hair, closed eyes, open-mouthed smile, freckles, evil smile, dynamic pose, happy emotion, warrior ,

反向提示词：bad-artist, energy, (turn pale), blue face

点击生成，可以看到stable diffusion绘制的是独特风格的图片。

Hypernetworks实际上类似于间接版的LoRA，而通过训练一个神经网络再去生成LoRA参数这种间接方式实现的效果往往并不是最有效或最优的，所以Hypernetworks目前使用已经比较少。

好了，本节课的课程到这里就结束了，我们做一下总结，本节课程我们讲述了另外两种控制图像输出特征和风格的方法---embedding和hypernetwork，embedding在实践中会经常使用到，尤其在反向提示词中，我们会经常使用一些embedding来避免图片出现不适合的元素。hypernetwork目前在实践中使用已经很少，大家了解其基本使用方法即可。

我们通过前面几节课程的讲解，相信大家已经能很好地使用stable diffusion绘制出优秀的图像，后续的课程，我们会重点讲解stable diffusion中控制图像输出的一项重要手段---ControlNet，ControlNet的引入可以使stable diffusion的图像控制能力大幅提升，也是stable diffusion走向实际生产应用的关键。

原文地址：https://blog.csdn.net/HuggingAI/article/details/143803427

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：企业网络链路聚合、数据抓包、远程连接访问实验
下一篇：【更新至2023】A股上市公司企业突破性创新、渐进性创新数据（2000-2023年）

matlab--pdist2(X,Y)使用方法、怎么计算的
定义一个忽略NaN值坐标的自定义距离函数，并使用该自定义距离函数计算两两距离。假设缺少X(1,1)。%假设缺少 X(1,1)。%计算汉明距离输出：D1 =如果X中的观测值i或Y中的观测值j包含NaN值
阅读更多2024-11-17
web H5网页中嵌入优量汇的插屏广告
如果你的商品没有上架应用市场就选择测试上架成功之后可以选择正式媒体审核成功之后就可以下一步。我们在进入某些App 软件的时候经常会看到一些插屏广告 , 因为看着些广告可以赚取费用。这样就可
阅读更多2024-11-17
JDBC-Dao层模式
分层思维是软件架构设计的一种重要思想，它通过将应用程序划分为多个关系的层。通常分为以下三层关系。web层：主要负责与用户进行交互，处理请求。service层：业务逻辑层，主要负责处理应用程序的业务逻辑
阅读更多2024-11-17
JAVA接入WebScoket行情接口
之前爬行情网站提供的level1行情接口不稳定。websocket接入level2行情接口。Java脚好用的库很多，开发效率一点不输Python。如果是日内策略，需要更实时的行情数据，不然策略滑点太大
阅读更多2024-11-17
前端页面一些小点
1. 让输入框无边框。
阅读更多2024-11-17
以太坊基础知识结构详解
EVM：一个沙盒环境，负责执行智能合约代码。它是图灵完备的，支持多种编程语言，确保智能合约的安全执行。以太坊的区块是区块链的基本组成单位，每个区块包含一组交易记录，并通过哈希值与前一个区块相连，形成链
阅读更多2024-11-17
Spring Boot 中 Druid 连接池与多数据源切换的方法
Druid是阿里巴巴开源的一个数据库连接池，它不仅提供了高效的数据库连接管理，还具备监控、扩展等强大功能。监控能力：提供了详细的监控页面，可以实时监控SQL执行情况、连接池状态等。扩展能力：支持多种数
阅读更多2024-11-17
【MySQL】MySQL中的函数之JSON_KEYS
在 MySQL 中，函数用于获取 JSON 对象中的所有键名。这个函数非常有用，特别是在你需要知道 JSON 对象中包含哪些键时。下面是一些关于如何使用的详细说明和示例。
阅读更多2024-11-17
C++ 模板
模板是另一个编程思想（泛型编程）的一种技术。模板就是建立通用的模具，大大提高复用性。一寸照片模板：模板的使用前提：模板不能直接使用，需要塞入我们自己的内容。模板不是万能的（例如不能用PPT模板去套一寸
阅读更多2024-11-17
【C++】定义缓冲区数组，但出现0xCCCCCCCC的情况，导致未定义行为，Visual Studio 调试器可以查看
【C++】定义缓冲区数组，但出现0xCCCCCCCC的情况，导致未定义行为，Visual Studio 调试器可以查看
阅读更多2024-11-17

Stable Diffusion Hypernetwork Embedding

一：Embedding

二: Hypernetwork

相关文章