《Hello YOLOv8从入门到精通》3，目标检测数据集和标注规范

🕗 发布于 2024-11-22 08:38 目标跟踪计算机视觉 人工智能

YOLOv8目标数据集的基本格式和标注规范对于训练出高效、准确的模型很重要。具体如下：

一、数据集基本格式

图像文件：数据集中的图像文件，通常是jpg或png等常见图像格式。这些图像包含了待检测的目标。
标注文件：标注文件是包含每张图像中目标对象的类别和位置信息的文本文件。标注文件的名称必须与图像文件的名称保持一致（除扩展名外）。
1）YOLO 格式：
这是 YOLO 系列模型常用的标注格式。在 YOLO 格式的标注文件中，每一行对应一个目标物体的标注信息。标注信息通常包含类别编号、目标中心横坐标（相对于图像宽度）、目标中心纵坐标（相对于图像高度）、目标宽度（相对于图像宽度）和目标高度（相对于图像高度）。例如，一个标注文件中的一行可能是 “0 0.5 0.6 0.3 0.4”，这里 “0” 表示类别编号，后面的数字表示目标在图像中的位置和大小信息。标注文件的文件名通常与对应的图像文件名相同，只是扩展名不同（如.jpg 对应的标注文件可能是.txt）。
2）COCO 格式：
这是一种在目标检测领域广泛使用的标注格式，尤其是在大规模数据集（如 COCO 数据集）中。
COCO 格式的标注文件是 JSON 格式的，它包含了更丰富的信息。其中主要的部分包括 “images”、“annotations” 和 “categories”。
“images” 部分记录了图像的基本信息，如文件名、图像尺寸、图像 ID 等；
“annotations” 部分包含了每个目标物体的标注信息，如目标类别 ID、边界框坐标（通常是左上角和右下角的坐标）、分割信息（如果有）等；
“categories” 部分定义了类别信息，包括类别名称、类别 ID 等。这种格式方便存储和管理大规模的标注数据，并且可以用于多种计算机视觉任务，不仅仅是目标检测。
类别文件：类别文件包含了数据集中所有目标对象的类别信息。
它通常是一个文本文件，其中每行代表一个类别，行号代表类别ID。此外，也可以使用json格式的类别文件，以更灵活地描述数据集的类别信息。

二、标注规范

标注格式：
- YOLOv8的标注文件通常采用以下格式：<object-class-id> <x> <y> <width> <height>。其中，<object-class-id>是目标对象的类别编号，<x>和<y>是目标中心位置的坐标（经过归一化处理，即目标的真实x、y值除以图像的宽度和高度），<width>和<height>是目标的宽度和高度（同样经过归一化处理）。
- 另一种常见的格式是：列1为目标类别id，列2为目标中心位置x，列3为目标中心位置y，列4为目标宽度w，列5为目标高度h。这些值都是小于1的浮点数。
标注要求：
- 目标框必须框住整个目标物体，不能有遗漏和重叠。
- 目标框的宽度和高度应该为正数，不能为零或负数。
- 如果一张图片中有多个目标物体，每个目标物体应该用一个独立的目标框进行标注，不允许多个目标共用一个框。
- 如果目标物体的形状不规则，可以使用多个框进行标注，但必须确保每个框都框住目标物体的一部分，且所有框的并集能够完全覆盖目标物体。
- 目标框的坐标必须在数据集中统一，以确保模型训练的一致性和准确性。
标注工具：
- 可以使用多种标注工具进行标注，如LabelImg、Labelme等。
- LabelImg：
  - LabelImg是一个开源的图像标注工具，支持多种标注格式，包括YOLO格式。
  - 使用LabelImg进行标注时，需要先安装该工具，然后加载需要标注的图片文件夹，并选择标注结果存放文件夹和标注格式（选择YOLO）。
  - 标注过程中，可以使用快捷键（如w键选择矩形框进行标注，ctrl+s保存标注结果，d键切换下一张图片）来提高标注效率。
- MakeSense：
  - MakeSense是一个在线标注平台，支持多种标注类型和格式，包括YOLO格式。
  - 使用MakeSense进行标注时，需要先注册并登录平台，然后创建标注项目并上传需要标注的图片。
  - 在标注项目中，可以选择逐次添加标签或一次性添加标签文件，然后按照提示进行标注。
- Labelme：
  - Labelme是另一个常用的图像标注工具，支持多边形、矩形、圆形等多种标注形状。
  - 虽然Labelme默认不支持YOLO格式，但可以通过编写脚本将标注结果转换为YOLO格式。
  - 标注完成后，需要导出标注结果（通常为json格式），然后使用脚本进行格式转换。
数据增强：
- 为了提高模型的泛化能力和鲁棒性，可以对数据集进行增强处理。常见的增强方式包括翻转、裁剪、旋转、平移等几何变换操作。
- 数据增强可以在标注前或标注后进行，但需要注意保持标注信息与增强后的图像一致。
数据集划分
- 数据集通常被划分为训练集、测试集和验证集（可选）。训练集用于模型的训练过程；测试集用于评估模型的性能和泛化能力；验证集（如有）则用于在训练过程中调整模型参数和选择最佳模型。
- 划分数据集时，需要确保各个子集中的样本分布相似，以避免因数据分布不均导致的模型偏差。
注意事项
标注格式：
- 确保标注结果符合YOLOv8模型训练的要求，即每个目标物体都有一个唯一的类别编号和位置信息（中心坐标、宽度和高度）。
标注质量：
- 标注过程中需要仔细、耐心，确保标注信息准确无误。
- 对于复杂场景或目标物体较多的图片，可以多次检查并调整标注结果。
数据增强：
- 为了提高模型的泛化能力和鲁棒性，可以对数据集进行增强处理（如翻转、裁剪、旋转等）。
- 数据增强后需要重新进行标注，并确保标注信息与增强后的图像一致。
数据集划分：
- 将数据集划分为训练集、验证集和测试集（如有需要），并确保各个子集中的样本分布相似。
加载数据：
- 在标注工具中加载需要标注的图片文件夹，并选择标注结果存放文件夹和标注格式（YOLO格式）。
进行标注：
- 使用标注工具提供的工具（如矩形框、多边形等）对图片中的目标进行标注。
- 标注过程中，需要确保目标框完全框住目标物体，并且标注信息准确无误。
保存标注结果：
- 标注完成后，保存标注结果到指定的文件夹中。
- 如果使用的是Labelme等工具，需要编写脚本将标注结果转换为YOLO格式。
检查标注质量：
- 对标注结果进行质量检查，确保标注信息准确无误，并且符合YOLOv8模型训练的要求。

原文地址：https://blog.csdn.net/Jagua/article/details/143949073

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：神经网络的初始化
下一篇：大数据新视界 -- Hive 数据仓库：架构深度剖析与核心组件详解（上）（1 / 30）

Cocos creator 3.8 支持的动画 7
帧动画龙骨动画骨骼动画 3D模型动画
阅读更多2024-11-23
xtu oj Estrella‘s Chocolate
【代码】xtu oj Estrella‘s Chocolate。
阅读更多2024-11-23
从 HTML 到 CSS：开启网页样式之旅（开篇之一）——CSS 初体验与网页样式新征程
本文以在已有 HTML 知识基础上开启 CSS 探索之旅为主题，首先阐述了 HTML、CSS 和 JavaScript 在网页构建中分别承担的结构、表现和行为作用，强调 CSS 对美化网页的重要性。接
阅读更多2024-11-23
《Mastering Ethereum》读书笔记1--What Is Ethereum
1. 第一章Implications of Turing Completenessgas。
阅读更多2024-11-23
拥抱极简主义前端开发：NoCss.js 引领无 CSS 编程潮流
NoCss.js 是一款全新的前端开发工具，它的出现为解决上述问题提供了一种简洁而高效的方案。正如其名，它允许开发者仅使用 HTML 属性来定义元素的样式，完全摒弃了传统的 CSS 类名和样式表。通过
阅读更多2024-11-23
CSS给元素的四个角添加边框
在元素四周各绝对定位一个块级元素，给这个元素添加对应的边框即可。相对简单，代码不再演示。
阅读更多2024-11-23
麒麟部署一套mysql集群，使用ansible批量部署可以提高工作效率
六、服务端执行mysql roles，使业务机器自动部署mysql。1.客户端设置root密码（密码：devuser_123）一、服务端和客户端同时配置kylin镜像。四、按照mysql角色的规则创
阅读更多2024-11-23
彻底理解消息队列的作用及如何选择
1)RabbitMQ 于 2007 年发布，是使用 Erlang 编程语言编写的，最早是为电信行业系统之间的可靠通信设计的，也是少数几个支持 AMQP 协议的消息队列之一；2)RabbitMQ 的轻量
阅读更多2024-11-23
云轴科技ZStack亮相2024 IDC中国生态峰会，共塑AI时代IT生态新格局
在生态合作方面，ZStack与生态伙伴构建完整的云生态，已经完成260+家软硬件产品适配，其中包含140+家信创产品适配，涵盖芯片、存储、服务器、操作系统、中间件、数据库、安全、容灾等领域，打造新基建
阅读更多2024-11-23
《气味传感器：嗅觉科技的新前沿》
半导体型气味传感器长期以来一直被用作气体传感器，当气味分子吸附到半导体表面时，会发生表面反应，半导体的电阻值发生变化，该机制根据电阻的变化来检测气味。半导体气味传感器有氧化物半导体型和有机半导体型两种
阅读更多2024-11-23

《Hello YOLOv8从入门到精通》3，目标检测数据集和标注规范

一、数据集基本格式

二、标注规范

标注格式：

标注要求：

标注工具：

数据增强：

数据集划分

注意事项

《Hello YOLOv8从入门到精通》3，目标检测数据集和标注规范

一、数据集基本格式

二、标注规范

标注格式：

标注要求：

标注工具：

数据增强：

数据集划分

注意事项

相关文章