实现了图像处理、绘制三维坐标系以及图像合成的操作

🕗 发布于 2024-11-22 15:33 图像处理 人工智能

这段代码实现了图像处理、绘制三维坐标系以及图像合成的操作，具体步骤如下：

1. 图像加载与显示

image = cv2.imread("D:/papers/picture/foreground.png")
mask = cv2.imread("D:/papers/picture/insulator.jpg")
jiazi_mask = cv2.imread("D:/papers/picture/6201726039514_.pic.jpg")

使用 OpenCV 的 cv2.imread() 方法加载三张图像，分别是前景图（foreground.png），绝缘子掩膜（insulator.jpg），以及夹子掩膜（jiazi_mask.jpg）。

# 创建一个 1 行 3 列的子图
plt.figure(figsize=(15, 5))

plt.subplot(1, 3, 1)
plt.imshow(image)
plt.title("Foreground")
plt.axis('off')

plt.subplot(1, 3, 2)
plt.imshow(mask)
plt.title("Insulator Mask")
plt.axis('off')

plt.subplot(1, 3, 3)
plt.imshow(jiazi_mask,cmap='gray')
plt.title("Jiazi Mask")
plt.axis('off')

plt.tight_layout()
plt.show()

将这三张图像放在一个 1 行 3 列的子图中进行显示，图像分别是前景、绝缘子掩膜和夹子掩膜。

2. 图像预处理

image = np.mean(image, axis=2)  # 将架子的图像按通道数进行求平均，将图片压扁, 得到单通道的图像。
new_image = np.random.rand(*image.shape[:2])  # 随机生成与原始图像相同尺寸大小的新的图像。
new_image[image == 0] = 0  # 按照image图像中的像素值为0的位置，将新的图像置0，保留其它的像素值。

将 image 转换为单通道图像（灰度图），通过取三通道（RGB）的均值。
创建一个与图像 image 同样尺寸的随机图像，并在 image 中像素值为0的位置将其置为0。

3. 掩膜处理与图像大小调整

insulator = cv2.resize(mask, (1152, 864))
insulator = np.mean(insulator, axis=2)
insulator[insulator != 255] = 0

jiazi_mask = cv2.resize(jiazi_mask, (1152, 864))
jiazi_mask = np.mean(jiazi_mask, axis=2)
jiazi_mask[jiazi_mask != 255] = 0

将 mask 和 jiazi_mask 调整为 1152x864 的尺寸，并通过 np.mean() 转换为灰度图。
将这些掩膜中值不为255的像素值设为0，保留掩膜区域。

4. 二值化处理

threshold = 1
new_image[new_image < threshold] = 0
new_image[new_image > threshold] = 255
new_image = new_image.astype(np.uint8)

将 new_image 二值化，设定阈值为1，将大于1的像素设为255，小于1的像素设为0，最终将图像转为 uint8 类型。

5. 图像合成

show_image = np.ones([*new_image.shape[:2], 3])
plt.imshow(show_image.astype(np.uint8), cmap="gray")

创建一个全为1的三通道（RGB）图像，并通过 imshow() 显示出来。

show_image = show_image * 255

将图像 show_image 的值乘以255，生成一个白色背景的 RGB 图像。

show_image[new_image == 255] = (31, 41, 55)

将 new_image 中像素值为 255 的区域的 RGB 值设置为 (31, 41, 55)（一个深蓝色）。

show_image[np.logical_and((insulator == 255), new_image != 0)] = (0, 255, 0)
show_image[np.logical_and((jiazi_mask == 255), new_image != 0)] = (0, 0, 255)

将掩膜 insulator 中像素为255的位置的区域设置为绿色 (0, 255, 0)。
将掩膜 jiazi_mask 中像素为255的位置的区域设置为蓝色 (0, 0, 255)。

6. 三维坐标系绘制

from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

ax.set_xlabel('X Axis')
ax.set_ylabel('Y Axis')
ax.set_zlabel('Z Axis')

ax.plot([0, 1], [0, 0], [0, 0], color='r', label="tower")
ax.plot([0, 0], [0, 1], [0, 0], color='g', label="insulator")
ax.plot([0, 0], [0, 0], [0, 1], color='b', label="transmission line")

使用 matplotlib 的三维坐标系模块 Axes3D 创建一个 3D 图像。
绘制三个不同颜色的轴线来表示电塔（红色）、绝缘子（绿色）和输电线（蓝色）。

plt.savefig('D:/papers/picture/coords.png')

保存绘制的三维坐标系图像。

7. 图像合成与透明化处理

img = Image.open('D:/papers/picture/show_image.png').convert("RGBA")

使用 PIL 打开生成的图像，并转换为 RGBA 模式（带透明通道）。

# 遍历图像数据，将白色像素转换为透明
new_data = []
for item in data:
    if item[:3] == (255, 255, 255):
        new_data.append((255, 255, 255, 0))
    else:
        new_data.append(item)
img.putdata(new_data)

遍历图像数据，将所有白色像素（255, 255, 255）转换为透明。

8. 前景与背景合成

background = Image.open('D:/papers/picture/coords.png').convert("RGBA")
foreground = Image.open('D:/papers/picture/output.png').convert("RGBA")

打开背景图像和前景图像（带透明通道的 PNG），并转换为 RGBA 模式。

background = background.resize((int(fg_width * 2.5), int(fg_height * 2.5)))
position = ((bg_width - fg_width) // 2, (bg_height - fg_height) // 2)
background.paste(foreground, position, foreground)

将背景图像的大小调整为前景图像的 2.5 倍，并将前景图像粘贴到背景图像的中央，使用前景图像的 alpha 通道作为掩码。

9. 裁剪白色边缘

min_x, min_y = bg_width, bg_height
max_x, max_y = 0, 0

for y in range(bg_height):
    for x in range(bg_width):
        pixel = background_data[y * bg_width + x]
        if pixel[0] < 255 or pixel[1] < 255 or pixel[2] < 255:  # 非白色
            if x < min_x: min_x = x
            if x > max_x: max_x = x
            if y < min_y: min_y = y
            if y > max_y: max_y = y

遍历背景图像数据，找到非白色区域的边界，并进行裁剪。

10. 保存并展示合成后的图像

cropped_background.save('combined_cropped.png')
plt.imshow(cropped_background)
plt.axis('off')
plt.show()

保存裁剪后的合成图像，并展示。

总结：

这段代码综合使用了图像预处理、掩膜操作、图像合成、三维坐标系绘制、透明化处理等技术，最终实现了图像的合成与裁剪，并将其保存为一个新的 PNG 图像。

原文地址：https://blog.csdn.net/weixin_50563385/article/details/143867289

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：spring boot jpa中 Hibernate 注解 @Immutable 的使用场景
下一篇：input自动获取焦点

Windows电脑本地部署llamafile并接入Qwen大语言模型远程AI对话实战
Windows电脑本地部署llamafile并接入Qwen大语言模型远程AI对话实战
阅读更多2024-11-23
解决vm虚拟机中ctrl键粘滞问题（一直处于按下状态）
虚拟机中点击鼠标左键没有问题，单独按下键盘也没有问题，但是如果按下键盘的同时在按下鼠标左键就会卡住。而且100%稳定复现。发现问题原因：vm版本的问题，我的版本是17.5.0，升级成17.5.2 bu
阅读更多2024-11-23
第十章 JavaScript的应用
10.1.1 JavaScript简介1 简单性JavaScript 设计之初就考虑到了非专业程序员的使用，因此它的语法相对简单，容易上手。2 动态性JavaScript 是一种解释型语言，代码可以在
阅读更多2024-11-23
非root用户安装CUDA
4.下载完成后执行.run文件，需要添加两个参数，一个是--override，用于跳过某些检查或限制；另一个是--toolkitpath，它表示安装路径，必须是自己目录下面的路径，如果是根目录就会安装
阅读更多2024-11-23
Python操作neo4j库py2neo使用之py2neo 删除及事务相关操作（三）
【代码】## Python操作neo4j库py2neo使用之py2neo 删除及事务相关操作（三）
阅读更多2024-11-23
【通俗理解】Jensen不等式与变分分布q(z)在积分计算中的应用
Jensen不等式 #变分分布 #积分计算 #期望 #凸函数 #优化问题 #下界估计 #机器学习。
阅读更多2024-11-23
「Mac玩转仓颉内测版27」基础篇7 - 字符串类型详解
本篇将介绍 Cangjie 中的字符串类型，包括字符串的定义、字面量形式、插值表达、常用操作及应用场景，帮助开发者熟练掌握字符串的使用。
阅读更多2024-11-23
数据科学与SQL：组距分组分析 | 区间分布问题
绝对值分布分析也可以理解为组距分组分析。对于某个指标而言，一个记录对应的指标值的绝对值，肯定落在所有指标值的绝对值的最小值和最大值构成的区间内，根据一定的算法，在把这个区间划分为等距离的几个小区间，，
阅读更多2024-11-23
c++编译报C1004错误的原因及解决办法
可能是你的代码文件最后没有正确的结束符，或者是缺少了一些必要的头文件或语句。默认磁盘驱动器没有足够的空间用于临时文件，需要大约两倍于源文件的空间。编译器到达了源文件尾但未解析构造。计算结果为假的 #i
阅读更多2024-11-23
mysql 去重补全取出重复变量函数和存储过程
mysql 去重补全取出重复变量函数和存储过程
阅读更多2024-11-23