stable diffusion Controlnet常用控制类型解析与实战课程 3

🕗 发布于 2024-12-08 08:48 stable diffusion 人工智能 ai绘画

本节内容，给大家带来的是stable diffusion Controlnet常用控制类型解析与实战的第三节课程。前两节的课程，我们已经了解了controlnet一些常用控制类型的用法，包括线稿类，姿态，深度，语义分割控制类型，本节课程，我们将继续讲解一些与图像风格约束相关的controlnet 控制类型 - shuffle、reference和normalmap

这几个控制类型通过将图片的风格，包括颜色，角色，光影等元素特征提取，进而控制图片的绘制。

一：Shuffle

首先看一下shuffle控制类型，该控制类型可以将图片颜色特征融合到新的图像中。

我们看一下shuffle预处理器如何控制绘图，

这里有一幅山水水墨画以及一幅人物图像，我们启用两个controlnet，第一个controlnet单元使用canny，并上传人物图像做参考图，用于提取人物线稿，

第二个controlnet单元选择shuffle，并上传水墨画作为参考图。需要特别提醒的是。使用shuffle引入图片风格时会影响整体构图，我们通常需要调整“引导介入时机”参数，先生成出大体的形状再去改变画风，我们这里设置为0.3，

点击生成。可以看到绘制的人物图片已经融入了水墨画特征。

二：Reference

我们再看一个图像风格约束控制类型reference，

ai绘画有一个很现实的问题，多次出图要保证每次画出的都是同一个人物的话，很困难。即使固定同一个seed值，改变提示词，人物还是可能发生明显变化。比如我们使用一张之前生成的图像，在提示词中增加了smile，固定种子值，所以参数值保持一致，点击生成，绘制的图片，人物还是发生了较大的变化。

要想保持人物一致性，我们可以通过训练同一个人物的高质量Lora来达到目的，但训练lora需要消耗计算资源与时间，并且本身就需要大量同一个人物的图像资源。

controlnet插件的Reference控制类型，以非常出色的表现给出了新的解决方案。reference控制类型可以在绘制图片的过程中，参考原图的角色特征。

reference有几个细分预处理器

启用controlnet后，选择reference，预处理器会自动选择reference_only，该预处理器非常强大，会参考图中的风格以及人物脸部特征，绘制图片的角色相似度非常高。比如刚刚的例子中，参数，种子保持一致，使用reference_only预处理器，上传人物图像，我们在提示词中增加一些表情元素，

比如添加smile(1 girl,smile)，介入时机设置为0，

点击生成，可以看到生成的图片角色基本还原了原角色特征。

我们也可以比较一下和图生图的差别，我们使用图生图，添加参考图，然后提示词也填入1 girl,smile, 点击生成，可以看到绘制的新的图片角色其实和原图有较大差别，已经可以明显看出不是同一个人了。即使我们固定随机种子，生成的图片和原角色仍然有较大差别，看不出来是同一个人物。

又比如如果使用reference_only, 我们可以增加一个耳环

使用提示词1 girl, ear pendants，种子值设置为-1

可以看到人物的角度虽然发生了变化，但是和原图的人物角色相似度仍然比较高。

Reference_only虽然不如使用人物lora输出那么稳定，但仍然是一个非常优秀的人物一致性出图解决方案。

另外，除了人物，reference_only在动物特征一致性上也有着非常好的表现。

Reference_only是使用较多的预处理器，reference控制类型还有另外两个细分预处理器

这里是使用这几个预处理器生成图片的对比

Reference adain，采用了自适应规范，但是该预处理器会更偏向于使用的模型，所以结果可能偏离参考图

Reference adain+attn，比Reference adain在人物一致性上处理得更好，绘制的图片人物相似度也更高

三：NormalMap

我们继续讲解另外一个控制类型-normalmap，normalmap提供了基于法线贴图的图像控制方式。对于法线贴图，熟悉渲染的同学可能经常遇到，他主要通过使用深度以及表面变形的方式为模型添加凹凸的立体效果，

上传一张参考图，使用normalmap控制类型，点击预览，normalmap预处理器会根据一定算法计算生成图像的法线贴图，

然后根据法线贴图控制图像的生成过程。

normalmap有两个细分预处理器

normal_bae和normal_midas,两者的区别就是使用了不同的算法。我们可以对比一下两者的区别《ppt图片》

normal_bae 法线贴图倾向于背景和前景整体渲染，他能更好地还原图片中的整体风格

normal_midas 法线贴图则适合将主体与背景分离开，生成的图片中，背景和某些元素可能会被抹除。

normal_midas提供了Normal Background Threshold选项用于调整背景分离程度，

我们可以对比一下不同取值提起的信息，可以看到，该值越低，背景信息保留得越多，越高，背景信息则保留得越少

好了，本节课的课程到这里就结束了，我们做一下总结。本节课程我们主要讲述了shuffle、reference和normalmap这三个与风格约束相关的控制类型，这些控制类型可以基于参考图片的颜色，角色，光影等特征，控制图片的绘制。下节课程我们将继续讲述几个重要的控制类型，比如可用于图片高清修复的tile控制类型，可以给老照片上色的recolor控制类型等等，这些控制类型提供了很多有价值的图像控制思路，也是controlnet控制体系的重要组成部分。

原文地址：https://blog.csdn.net/HuggingAI/article/details/144269013

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：高级java每日一道面试题-2024年12月07日-JVM篇-如何选择垃圾收集器?
下一篇：如何解决 org.ietf.jgss.GSSException 异常问题？亲测有效的解决方法！

深入探讨 Rust 与 C 的对比及其在内存安全和跨语言调用中的应用
Rust 提供了强大的内存安全机制，通过所有权和生命周期检查来避免内存泄漏、踩内存等问题。与 C 不同，Rust 通过编译时检查显著减少了内存错误。Rust 可以调用 C 函数，C 也可以调用 Rus
阅读更多2024-12-27
青少年编程与数学 02-004 Go语言Web编程 15课题、表单处理
本文讨论了Web应用中表单处理的重要性和实现步骤。表单处理包括创建表单、接收数据、验证、处理和返回响应。文章提供了一个Go Web应用的示例，展示了如何创建HTML表单、编写处理函数以及处理表单提交。
阅读更多2024-12-27
【安全编码】Web平台如何设计防止重放攻击
重放攻击（Replay Attack）是指攻击者通过重复或延迟传送合法数据包来实现欺骗或获取未经授权访问的行为。在Web环境中，重放攻击通常涉及截获和重新发送合法用户的请求，以冒充该用户进行操作。重放
阅读更多2024-12-27
【漫话机器学习系列】021.类别特征（Categorical Feature）
类别特征（Categorical Feature）是指取值为有限的、不连续的类别或标签的数据特征。在机器学习和数据分析中，类别特征经常用于描述对象的分类属性，例如颜色、性别、职业等。类别特征在实际问题
阅读更多2024-12-27
用 Python 从零开始构建 LLaMA 3
本文是经过严格查阅相关权威文献和资料，形成的专业的可靠的内容。全文数据都有据可依，可回溯。特别申明：数据和资料已获得授权。本文内容，不涉及任何偏颇观点，用中立态度客观事实描述事情本身。
阅读更多2024-12-27
母婴用品系统｜Java｜SSM｜JSP｜
2⃣️：管理端：主页、个人中心、商品分类管理、用户管理、商品信息管理、留言板管理、成长交流、美食社区管理、系统管理、订单管理、留言管理。4⃣️：技术栈：Java、Mysql、SSM、Mybatis-P
阅读更多2024-12-27
网络安全top国际会议
学术会议会议名称会议全称类型出版社网址A类1S&P大类IEEE2CCS大类ACM3USENIX大类USENIX4EUROCRYPT偏密码Springer5CRYPTO偏密码SpringerB类
阅读更多2024-12-27
深入理解贪心算法：核心概念与实践
贪心算法是一种算法设计策略，它通过逐步构建解的方式，每次选择当前看似最优的解来尝试获得全局最优解。贪心选择性质：通过局部最优的选择能够逐步构造出全局最优解。最优子结构性质：问题的最优解可以通过其子问题
阅读更多2024-12-27
HarmonyOS NEXT 实战之元服务：静态案例效果--- 歌手推荐
HarmonyOS NEXT 实战之元服务：静态案例效果--- 歌手推荐
阅读更多2024-12-27
机器学习(三)-多项式线性回归
我们发现如果把人口数量当成自变量X，把房价当成因变量Y，此时，y与 X 并不是呈现简单线性关系，我们无法用一条直线来拟合真实的数据。但是我们发现 y 与 x 呈现一种二次函数的关系，那我们就可以使用一
阅读更多2024-12-27

stable diffusion Controlnet常用控制类型解析与实战课程 3

一：Shuffle

二：Reference

三：NormalMap

相关文章