「Pytorch」roLabelImg 图像异常旋转 bug

🕗 发布于 2024-07-13 07:44 PyTorch YOLO LabelImg roLabelImg QImage

在进行Yolo-obb 模型训练的时候需要标注旋转框，roLabelImg 是比较推荐的一款旋转框标注工具，既可以标注正常的矩形框，还可以标注旋转框

roLabelImg Github 地址：https://github.com/HumanSignal/labelImg

但是在使用过程中遇到了一个比较难搞的bug。对于手机等拍摄的图像，除了图像内容还会保存很多其他信息，比如下图的旋转，采用不同的方式打开，效果是不一样的，使用常规的图像查看就是正常的，但是使用 roLabelImg 打开就会发现逆时针旋转 90度。由于roLabelImg 开发较早，目测好像没人维护了，bug也没人解决了，对于项目比较急的小伙伴，可以采用本文临时救急使用，后续有时间再修复bug

在这里插入图片描述

原因

先说下造成这种情况的原因。通过 roLabelImg.py 文件可以看出，roLabelImg 在读取图片的时候是先通过read 函数，将图像以二进制的形式读取所有内容，然后再 QImage.fromData 将像素信息提取出来，但是 QImage 读取的时候会根据图片的头信息结合旋转显示，而Yolo-obb模型读取数据的时候直接采用 opencv 的形式将图片读取出来，出入就此产生

def read(filename, default=None):
    try:
        with open(filename, 'rb') as f:
            return f.read()
    except:
        return default

在这里插入图片描述

解决办法

由于比赛时间紧迫，因此当时我们采用的解决方案是，将所有的图片重置一遍，简单点将就是使用 opencv 将图片读取之后，再将所有的像素内容保存一遍，从而去除掉图片中的头信息，在此推荐使用cv2.imdecode 进行读取，不受限于操作系统和中英文路径，而cv2.imread在windows系统下如果路径中有中文，则会跳过且不报错（又是一把辛酸泪(灬ꈍ ꈍ灬)），可以参考我的这篇博客查看细节cv2.imdecode & cv2.imread 的区别

import cv2
import numpy as np


image_data = np.fromfile(pred_image_path, dtype=np.uint8)# 从文件中读取图像数据
image = cv2.imdecode(image_data, cv2.IMREAD_COLOR)# 使用cv2.imdecode()解码图像数据

# 简写
image = cv2.imdecode(np.fromfile(pred_image_path, dtype=np.uint8), cv2.IMREAD_COLOR)# 支持中文，与cv2.imread 读取一致

在此建议不要原地覆盖，而是另保存一个路径，这样一来可以保存原有数据，以防后期需要，二来原地覆盖保存，可能因为 opencv 不提示警告、错误信息，导致重置失败而不自知，保存在其他路径，查看图片数量即可指导是否出错。

后续优化

明白人都知道，此方法只能解决燃眉之急，不是根本解决之道，因此真正的解决办法应该是采用OpenCV 或者 PIL读取图片，但是整个项目较为复杂，后续有时间再补上解决代码

原文地址：https://blog.csdn.net/ViatorSun/article/details/140374439

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Ubuntu 22.04.4 LTS (linux) Auditd 安全审计rm命令记录操作
下一篇：DockerCompose拉取DockerHub镜像，并部署OpenMetaData

[CUDA] cuda kernel开发记录
包括kernel的一些使用注意事项， launch_bound, __device__, debug排查技巧
阅读更多2024-11-16
【python】掌握 Flask：轻量级 Web 开发框架解析
路由是 Web 开发的基础，负责管理 URL 到视图函数的映射。在 Flask 中，路由定义非常简单，只需使用装饰器即可。这个代码段定义了一个路由，访问该路径时会返回 “Hello, Flask!通过
阅读更多2024-11-16
AI图片分析接口LiteAIServer摄像机实时接入分析平台未戴安全帽检测算法
随着人工智能技术的飞速发展，摄像机实时接入分析平台LiteAIServer工地未佩戴安全帽检测算法应运而生，为工地安全管理带来了革命性的变革。
阅读更多2024-11-16
2024新版pycharm如何切换anaconda虚拟环境
回归正题，导入项目后点击文件=>设置，找到解释器。不得不说这界面改的真不错，看着很舒服。另外在终端用指令切换也是可以的。添加解释器=>添加本地解释器。
阅读更多2024-11-16
计算机提示mfc140u.dll丢失的五种解决方法，了解mfc140u.dll错误的几种修复方法
当你尝试打开某些程序时，突然出现错误提示，告知你系统缺少 mfc140u.dll 文件，这可能让你感到困惑和无助。mfc140u.dll 是 Microsoft Foundation Class (M
阅读更多2024-11-16
k8s 中传递参数给docker容器
在 Kubernetes 中，可以通过多种方式将参数传递给 Dockerfile 或其运行的容器，常见的方式包括使用环境变量、命令行参数、配置文件等。
阅读更多2024-11-16
设计模式之工厂模式，但是宝可梦
作为一个细分了三个种类的设计模式，到底该如何取舍？比起直接new一个对象，使用对应模式的好处到底在哪？简单工厂模式：根据传入的参数决定产出的对象，可以隐藏一些创建的细节适用于需要根据条件创建不同对象的
阅读更多2024-11-16
【深度学习】wsl-ubuntu深度学习基本配置
这里注意一点，你换了源之后就最好不要开代理了，要不然搞不好下载失败，pip和conda都是。
阅读更多2024-11-16
nodejs和npm在gitbash中提示Not Found情况的解决办法
很多小伙伴学习了node以后，在cmd命令行中可以正常的获取node版本和npm版本，但是我们经常使用gitbash来管理git，这时候下载完gitbash后，在gitbash中输入node -v和n
阅读更多2024-11-16
判断子序列
给定一个长度为 n的整数序列 a1,a2,…,an以及一个长度为 m的整数序列 b1,b2,…,bm。请你判断 a序列是否为 b序列的子序列。子序列指序列的一部分项按原有次序排列而得的序列，例如序列
阅读更多2024-11-16

「Pytorch」roLabelImg 图像异常旋转 bug

原因

解决办法

后续优化

相关文章