【进阶OpenCV】（11）--DNN板块--实现风格迁移

🕗 发布于 2024-10-17 13:45 opencv dnn 人工智能 计算机视觉神经网络

文章目录

DNN板块
总结

DNN板块

DNN模块是 OpenCV 中专门用来实现 DNN(Deep Neural Networks,深度神经网络) 模块的相关功能，其作用是载入别的深度学习框架(如 TensorFlow、Caffe、Torch 等)中已经训练好的模型，然后用该模型完成预测等工作。

DNN进行风格迁移是一项基于深度学习技术的图像处理方法，它允许将一张图片（风格图）中的风格、纹理迁移到另一张图片（内容图）上，同时保留内容图原有的主体结构。

一、DNN特点

轻量: OpenCV 的深度学习模块只实现了模型推理功能，不涉及模型训练，这使得相关程序非常精简，加速了安装和编译过程。
外部依赖性低:重新实现一遍深度学习框架使得 DNN 模块对外部依赖性极低，极大地方便了深度学习应用的部署。
方便:在原有 OpenCV 开发程序的基础上，通过 DNN 模块可以非常方便地加入对神经网络推理的支持。
集成:若网络模型来自多个框架，如一个来自 TensorFlow，另外一个来自 Caffe,则 DNN 模块可以方便地对网络进行整合。
通用性:DNN 模块提供了统一的接口来操作网络模型，内部做的优化和加速适用于所有网络模型格式，支持多种设备和操作系统。

二、DNN函数流程

在这里插入图片描述

图像预处理：

将需要处理的图像转换成可以传入人工神经网络的数据形式。

DNN 模块中的函数 blobFromlmage 完成图像预处理，从原始图像构建一个符合人工神经网络输入格式的四维块。它通过调整图像尺寸和裁图像、减均值、按比例因子缩放、交换 B 通道和R通道等可选操作完成对图像的预处理，得到符合人工神经网络输入的目标值。

三、实现风格迁移

基本原理：风格迁移的实现通常基于卷积神经网络（CNNs），尤其是预训练的卷积神经网络（如VGG网络）。使用这些网络，可以提取内容图像的内容特征和风格图像的风格特征。这通常涉及到在网络的不同层次上计算特征表示。然后，定义一个损失函数，该函数包括内容损失和风格损失两个部分。内容损失用于确保生成图像与内容图像相似，而风格损失则用于确保生成图像的风格与风格图像匹配。通过最小化损失函数，使用梯度下降或其他优化方法来调整生成图像的像素值，使损失最小化，从而导致生成图像逐渐融合内容和风格。

接下来我们尝试将以下图片转化为星空风格：

在这里插入图片描述

1. 图像预处理

对于图像的预处理，我们需要通过cv2.dnn.blobFromImage()函数来将图像转换成可以传入人工神经网络的数据形式：

blob = cv2.dnn.blobFromImage(image, scalefactor, size, mean, swapRB=True, crop=False)

参数：

-- image (必需):要转换的图像，通常是一个通过 OpenCV 读取的彩色或灰度图像。
-- scalefactor (必需):图像缩放因子。这个值用于调整图像的像素值范围，通常设置为 1.0（不缩放）。
-- size (必需):输出 blob 的空间尺寸（宽度，高度）。这个值应该与你要使用的预训练模型的输入尺寸相匹配。
-- mean (可选):从每个通道中减去的均值。这通常用于数据标准化，以便模型能够更好地处理输入数据。对于预训练的模型，这个值通常是固定的，并且可以在模型的文档中找到。
-- swapRB (可选):是否交换红色和蓝色通道。
-- crop (可选):是否在预处理过程中裁剪图像。

预处理：

import cv2
"""-----图片预处理-----"""
# 读取输入图像
image = cv2.imread('tu.jpg')
# 显示输入图像
cv2.imshow('yuan_tu',image)
cv2.waitKey(0)

(h,w) = image.shape[:2] # 获取图像尺寸
blob = cv2.dnn.blobFromImage(image,1,(w,h),(0,0,0),swapRB = True,crop = False)

2. 加载星空模型

通过cv2.dnn.readNet()函数加载模型，通过**net.setInput()设置输入，然后通过net.forward()**进行前向传播得到输出：

net = cv2.dnn.readNet(r'model\starry_night.t7') # 得到一个pytorch训练后的星空模型

# 设置神经网络的输入
net.setInput(blob)
# 对输入图片进行前向传播，得到输出结果
out = net.forward()

3. 输出处理

将输出结果转换为合适的格式，out是四维的：B*C*H*W（B：batch图像数量（通常为1）；C：channels通道数；H：height高度；W：width宽度）。

所以我们需要重塑形状（忽略第一维），4维变3维，调整输出out的形状，模型推理输出out是四维BCHW形式的，调整为三维CHW形式。

# 重塑形状
out_new = out.reshape(out.shape[1],out.shape[2],out.shape[3])
# 对输入的数组（或图像）进行归一化处理，使其数值范围在指定的范围内
cv2.normalize(out_new,out_new,norm_type=cv2.NORM_MINMAX)
# 转置输出结果的维度，将通道维度移动到了最后，因为OpenCV期望图像以HWC格式显示。
result = out_new.transpose(1,2,0)
# 显示转换后的图像
cv2.imshow('Stylized Image',result)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

总结

本篇介绍了，如何通过DNN板块进行风格迁移。

注意！！！：进行风格迁移时，需要将传入的图片转换成可以传入人工神经网络的数据形式。且输出时进行转置，将通道维度移动到了最后，因为OpenCV期望图像以HWC格式显示。

原文地址：https://blog.csdn.net/m0_74896766/article/details/142906081

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：CENTOS上的网络安全工具（三十）DPDK和HyperScan环境构建
下一篇：在CentOS 7上如何从FirewallD迁移至Iptables

深度学习：异常检测（Anomaly Detection）详解
异常检测是一种在许多关键领域非常重要的技术，它帮助识别数据中的不正常模式，从而进行及时的响应或决策。随着数据量和复杂性的增加，开发更有效、更智能的异常检测系统将是未来研究和技术开发的重点。
阅读更多2024-10-17
error Replace `··` with `↹` react开发格式化问题
使用vscode的修复工具修复后保存，不会出现再次同样的问题。如何彻底修复：ctrl + ，在跳出的弹框里搜索。但是保存后还是和第一张图一样。使用vscode的修复工具。
阅读更多2024-10-17
QT总结(74)
Qt总结
阅读更多2024-10-17
Maya清理空组上的Anim
所以要计算从世界空间到舞台中心的变换矩阵, 即舞台中心在世界空间的Transform Matrix 的逆。输出角色基于世界空间,
阅读更多2024-10-17
Canny边缘检测、金字塔检测、轮廓检测
import cv2# 定义图像显示函数v1 = cv2.(img,
阅读更多2024-10-17
linux查看系统的上次重启时间的几种方法
在这个例子中，系统已经运行了 2 天 4 小时 15 分钟，表明大约 2 天前系统重启过。命令可以显示系统已经运行了多长时间，包括从上次启动到现在的时间。通过这些方法，你可以轻松查看 Linux 系统
阅读更多2024-10-17
R语言详解predict函数
R语言详解predict函数
阅读更多2024-10-17
【数据采集工具】Sqoop从入门到面试学习总结
数据采集工具——Sqoop内容学习整理，如有错误，欢迎评论区交流指出。
阅读更多2024-10-17
决策智能与强化学习：重放比率（replay ratio）
知乎：DILab决策实验室（已授权）链接：https://zhuanlan.zhihu.com/p/8986418630. 概览近年来，深度强化学习（Deep Reinforcement Learni
阅读更多2024-10-17
R语言lavaan结构方程模型（SEM）实践技术应用
基于R语言lavaan程序包，通过理论讲解和实际操作相结合的方式，由浅入深地系统介绍结构方程模型的建立、拟合、评估、筛选和结果展示的全过程。训练内容包括R语言入门、结构方程模型原理简介、lavaan包
阅读更多2024-10-17

【进阶OpenCV】 （11）--DNN板块--实现风格迁移

文章目录

DNN板块

一、DNN特点

二、DNN函数流程

三、实现风格迁移

1. 图像预处理

2. 加载星空模型

3. 输出处理

总结

相关文章

【进阶OpenCV】（11）--DNN板块--实现风格迁移