视觉目标检测标注xml格式文件解析可视化 - python 实现

🕗 发布于 2024-11-05 03:46 目标检测 xml python 数据可视化

视觉目标检测任务，通常用 labelimage标注，对应的标注文件为xml。

该示例来源于开源项目：https://gitcode.com/DataBall/DataBall-detections-100s/overview

读取 xml 标注文件，并进行可视化示例如下：

#-*-coding:utf-8-*-
# date:2024-09
# Author: DataBall - Xian
# function: show yolo data of voc format anno

import cv2
import os
import numpy as np
import xml.etree.cElementTree as et
import supervision as sv

if __name__ == "__main__":

    path_data='D:/dataset/img_list/bike/'

    idx = 0
    box_annotator = sv.BoxAnnotator()

    for file in os.listdir(path_data):
        if ".jpg" in file or ".png" in file:
            print(" ->[{}] {}".format(idx,file))
            path_img = path_data + file
            path_label = path_img.replace(".jpg",".xml").replace(".png",".xml")
            if not os.access(path_label,os.F_OK): # 判断标注文件是否存在
                continue
            img = cv2.imread(path_img) # 读取图片

            tree=et.parse(path_label)
            root=tree.getroot()
            for Object in root.findall('object'):
                name=Object.find('name').text # 获取类别名字
                # 获取坐标 xyxy
                bndbox=Object.find('bndbox')
                x1= np.float32((bndbox.find('xmin').text))
                y1= np.float32((bndbox.find('ymin').text))
                x2= np.float32((bndbox.find('xmax').text))
                y2= np.float32((bndbox.find('ymax').text))

                # opencv 方式可视化
                # cv2.rectangle(img, (int(x1),int(y1)), (int(x2),int(y2)), (255,100,100), 2)
                # cv2.putText(img, "{}".format(name), (int(x1),int(y1)),\
                # cv2.FONT_HERSHEY_PLAIN, 2.5, (0, 55, 255), 6)
                # cv2.putText(img, "{}".format(name), (int(x1),int(y1)),\
                # cv2.FONT_HERSHEY_PLAIN, 2.5, (0, 255, 0), 2)

                # sv.BoxAnnotator() 方式可视化
                box_ = np.array([int(x1),int(y1), int(x2),int(y2)]).reshape(-1,4)
                det_ = sv.Detections(xyxy=box_)
                img = box_annotator.annotate(scene=img, detections=det_, labels=[name])

            cv2.namedWindow('image',0)
            cv2.imshow('image',img)
            if cv2.waitKey(30) == 27:
                break
    cv2.destroyAllWindows()

助力快速掌握数据集的信息和使用方式。

原文地址：https://blog.csdn.net/weixin_42140236/article/details/143369892

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：后端：Spring、Spring Boot-配置、定义bean
下一篇：刘艳兵-DBA018-关于数据库处于ARCHIVELOG模式下的说法正确的是？

蓝桥杯py组入门（bfs广搜）
题目描述给定一个 N×M 的网格迷宫 G。G 的每个格子要么是道路，要么是障碍物（道路用 1 表示，障碍物用 0 表示）。已知迷宫的入口位置为 (x1,y1)，出口位置为 (x2,y2)。问从
阅读更多2024-11-05
深度学习之学习率
在梯度下降法中，都是给定的统一的学习率，整个优化过程中都以确定的步长进行更新，在迭代优化的前期中，学习率较大，则前进的步长就会较长，这时便能以较快的速度进行梯度下降，而在迭代优化的后期，逐步减小
阅读更多2024-11-05
java网络编程
（1）网络结构。
阅读更多2024-11-05
ICT网络赛道安全考点知识总结4
RADIUS和HWTACACS协议通常都使用共享密钥对传输的用户信息进行加密，以确保安全传输。用来封装EAP报文的RADIUS属性通常是"EAP-Message"，它用于传输EA
阅读更多2024-11-05
Linux：防火墙和selinux对服务的影响
文件夹的访问将自定义文件夹的角色改为我们nginx可以访问的httpd_sys_t便可以访问了。
阅读更多2024-11-05
应用层知识点总结2
直到结束的那一刻，我才希望开始，只是那一刻过后，我又开始流逝一、简单文件传送协议TFTP和FTP的主要区别是什么？各用在什么场合简单文件传送协议TFTP，它是一个很小且易于实现的文件传送协议。虽然TF
阅读更多2024-11-05
npm install -g @vue/cil 非常卡慢
时遇到卡慢的情况通常和网络问题有关，特别是国内的网络环境下访问 npm 的服务器可能较慢。淘宝 NPM 镜像源对国内用户更加友好。你可以临时使用淘宝镜像源安装。尝试这些方法后，安装速度应会有所提升。
阅读更多2024-11-05
报错：npm : 无法加载文件 C:\Program Files\nodejs\npm.ps1，因为在此系统上禁止运行脚本。
npm : 无法加载文件 C:\Program Files\nodejs\npm.ps1，因为在此系统上禁止运行脚本。有关详细信息，请参阅 https:/go.microsoft.com/fwlink
阅读更多2024-11-05
FRIENDLYARM Tiny6410 superboot烧写进sd卡教程
有些朋友这里是 avaliable是no不是yes 那就需要先reformat 再relayout 具体是为什么手册里也有说，但分在两个不同的pdf ***其实就是他的烧写系统只支持sd既有f
阅读更多2024-11-05
Spring Boot 中的过滤器 (Filter) 使用方案
在 Spring Boot 中，过滤器用于处理请求和响应的过程，可以在请求到达 Servlet 之前和响应返回客户端之前进行一些处理。本文将介绍三种在 Spring Boot 中使用过滤器的方法：使用
阅读更多2024-11-05

视觉目标检测标注xml格式文件解析可视化 - python 实现

相关文章