目标检测中的Bounding Box(边界框)介绍:定义以及不同表示方式
《------往期经典推荐------》
二、机器学习实战专栏【链接】,已更新31期,欢迎关注,持续更新中~~
三、深度学习【Pytorch】专栏【链接】
四、【Stable Diffusion绘画系列】专栏【链接】
五、YOLOv8改进专栏【链接】,持续更新中~~
六、YOLO性能对比专栏【链接】,持续更新中~
《------正文------》
引言
Bounding Box是目标检测中的一个基本概念。它们用于定义对象在图像中的位置。边界框本质上是一个包围对象的矩形,帮助模型识别和定位它。虽然边界框的概念很简单,但它们在数据中的表示方式可能会有所不同。在这篇博客中,我们将探讨什么是边界框,为什么它们很重要,以及用于存储它们的不同格式。
什么是Bounding Box?
边界框由其位置和大小定义。它通常由一组坐标组成,这些坐标指示矩形的位置和大小。深度学习模型使用这些坐标可以:
- 识别对象类别(例如,狗、猫)。
- 确定对象在图像中的位置。
边界框广泛用于以下应用:
- 自动驾驶汽车(检测行人、车辆和交通标志)。
- 医学成像(定位肿瘤或异常)。
- 零售(跟踪货架上的物品)。
边界框格式
1. Pascal VOC数据集格式
在这里创建边界框,需要2个点的坐标
这里xmin和ymin表示左上角,这意味着边界框的起始坐标,xmax和ymax表示边界框的右下角。
在torch vision API中,我们将这种格式称为xyxy
2. COCO数据集格式
在这里创建一个边界框,我们需要(xmin,ymin,width和height)
这里xmin和ymin表示左上角,表示边框的起始坐标,width和height表示边框的宽度和高度
在torch vision API中,我们将这种格式称为xywh
3. CXCYWH格式
这次我们将使用边界框的中心坐标、宽度和高度
来创建边界框
在torch vision API中,我们将这种格式称为cxcywh
4. YOLO边界框格式(标准化cxcywh格式)
在这里,我们将中心坐标、宽度和高度
每个值分别除以图像的宽度和高度进行归一化。
所以cxcywh格式看起来像这样
好了,这篇文章就介绍到这里,喜欢的小伙伴感谢给点个赞和关注,更多精彩内容持续更新~~
关于本篇文章大家有任何建议或意见,欢迎在评论区留言交流!
原文地址:https://blog.csdn.net/qq_42589613/article/details/145044676
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!