【目标检测】yolo的三种数据集格式

🕗 发布于 2024-10-04 11:48 目标检测 YOLO 人工智能

目标检测中数据集格式之间的相互转换--coco、voc、yolohttps://zhuanlan.zhihu.com/p/461488682?utm_medium=social&utm_psn=1825483604463071232&utm_source=wechat_session 【目标检测】yolo的三种数据集格式https://zhuanlan.zhihu.com/p/525950939?utm_medium=social&utm_psn=1825483832641581056&utm_source=wechat_session

在YOLO目标检测中，常用的标签格式主要有三种：voc(xml)、coco(json)和yolo(txt)。每种格式都有其独特的优点和适用场景。

voc(xml)格式：XML格式因其良好的可读性和扩展性，在目标检测领域得到了广泛应用。它不仅能够存储目标的边界框信息，还能包含其他元数据信息，如图像来源、拍摄时间等。
coco(json)格式：JSON格式以其轻量级和易于解析的特点，成为许多现代目标检测数据集的首选。它支持多层嵌套结构，能够更灵活地表示复杂的目标关系。
yolo(txt)格式：YOLO算法专用的txt格式标签，简洁明了，直接包含目标的类别和边界框坐标。这种格式在YOLO系列算法的训练中非常高效。

因为我以后的项目大概率继续用的是txt格式，所以本文只写txt格式的相关内容，其他格式参考上面的两个链接。

1、yolo的txt格式

yolov5的比较简单，就是图片和标签分别两个文件夹中，并且自己分类，将图片与标签按照一定的比例区分成训练集和验证集。

txt的标签如下图所示：

第一列为目标类别，后面四个数字为[x_center, y_center, w, h]，可以看到都是小于1的数字，是因为对应的整张图片的比例，所以就算图像被拉伸放缩，这种txt格式的标签也可以找到相应的目标。

使用makesense.ai（上一篇文章说过的一个超级强大的在线标注工具）标注之后直接输出的就是txt标签文件，分一下文件夹即可训练。

2、划分数据集

代码请教GPT

3、修改代码

自己的数据集标注好，分好之后当然是用模型进行训练啦。

1、custom.yaml文件

仿照./data/文件夹下的yaml文件，自己写一个

这边的"path" 和“names”改成自己的，这里笔者的train_data放在和yolov5相同目录下。

然后按照官方用例跑，data 参数改为自己的custom.yaml：

python train.py --data custom.yaml --epochs 300 --weights ./weights/yolov5s.pt --cfg yolov5s.yaml  --batch-size 128

原文地址：https://blog.csdn.net/m0_55259388/article/details/142700776

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：WPF入门教学二十二多线程与异步编程
下一篇：git使用“保姆级”教程4——版本回退及分支讲解

Visual Studio 是一款非常强大的开发环境，提供了许多快捷键来提高开发效率。
Visual Studio 是一款非常强大的开发环境，提供了许多快捷键来提高开发效率。这些快捷键可以帮助您在使用 Visual Studio 时更加高效。
阅读更多2024-10-04
看门狗电路设计
那么电源的上电时间，一般是几百个微秒到几个毫秒之间，所以说200个毫秒的时间就可以保证我的其他持续的电源也都完成上电，进入这种正常工作的状态。硬件看门狗芯片，Watch DogTimer，可用于受到电
阅读更多2024-10-04
轻松提高物流查询效率：快递单号批量查询物流派件中的
幸运的是，有一款软件能够一次性批量查询大量快递单号，无需逐个输入，大大节省了时间和精力。这里为大家分享一款批量查询软件，一键分析筛选出正在派件中的单号。轻松几个步骤就可查询出这么多的单号物流，而且分析
阅读更多2024-10-04
【pytorch】pytorch入门5：最大池化层（Pooling layers ）
使用 B站小土堆课程池化（Pooling）是深度学习中常用的一种操作，用于降低卷积神经网络（CNN）或循环神经网络（RNN）中的特征图的维度。池化操作的基本思想是将特征图划分为若干个子区域，然后对每个
阅读更多2024-10-04
C++中的类型推导：auto 和 decltype 介绍
auto关键字不会保留const等特性，decltype会保留。auto需要在变量声明的时候就初始化，decltype不需要在初始化的时候就进行初始化。decltype需要根据已有表达式、已有变量推导
阅读更多2024-10-04
跨平台音乐播放器Feishin
Feishin 是一个现代的自托管音乐播放器。其支持任何实现 Navidrome 或 Jellyfin API 的音乐服务器。
阅读更多2024-10-04
Python、C++、java阶乘算法
阶乘是数学中的一个概念，通常定义为从1乘到指定的数。具体来说，一个正整数的阶乘（记作n!例如，5的阶乘（记作5!此外，阶乘函数还可以通过递归的方式定义，即n!阶乘在数学中有广泛的应用，特别是在排列组合
阅读更多2024-10-04
netty之Netty心跳服务与断线重连
使用netty中，需要监测服务是否稳定以及在网络异常链接断开时候可以自动重连。需要实现监听；代码目录结构@OverrideSystem.out.println("client start d
阅读更多2024-10-04
【数据结构】栈、队列和数组
50。
阅读更多2024-10-04
栏目一：使用echarts绘制简单图形
Echarts是一款基于JavaScript的可视化图表库。它提供了丰富的图表类型和交互功能，可以用于在网页中展示各种数据。Echarts支持多种数据格式的转换和操作，可以轻松地将数据转换为图表所需的
阅读更多2024-10-04

【目标检测】yolo的三种数据集格式

1、yolo的txt格式

2、划分数据集

3、修改代码

相关文章