YOLOv11改进策略【损失函数篇】| 利用MPDIoU，加强边界框回归的准确性

🕗 发布于 2024-10-11 08:58 YOLO 目标检测计算机视觉 深度学习

一、背景

目标检测和实例分割中的关键问题：
- 现有的大多数边界框回归损失函数在不同的预测结果下可能具有相同的值，这降低了边界框回归的收敛速度和准确性。
现有损失函数的不足：
- 现有的基于 $\ell_n$ 范数的损失函数简单但对各种尺度敏感。
- 当预测框与真实框具有相同的宽高比但不同的宽度和高度值时，现有损失函数可能会存在问题，限制了收敛速度和准确性。

文章目录

一、背景
二、原理
三、添加步骤
四、成功运行截图

MPDIoU（Intersection over Union with Minimum Points Distance）是一种用于高效且准确的边界框回归的损失函数。

二、原理

2.1 IoU计算原理

IoU（Intersection over Union）即交并比，用于衡量预测边界框和真实边界框的重合程度。

1. 交集计算：
- 首先确定预测边界框和真实边界框的交集区域。
- 对于两个以左上角和右下角坐标表示的矩形框，分别找出它们在横坐标和纵坐标方向上的重叠区间。
- 如果两个矩形框在横坐标和纵坐标方向上都有重叠部分，那么这个重叠区域就是一个矩形，其面积就是交集的大小。
2. 并集计算：
- 计算预测边界框和真实边界框的并集区域。
- 并集的大小等于两个矩形框各自的面积之和减去它们的交集面积。
3. 比值计算：
- 最后，IoU的值就是交集面积与并集面积的比值。

2.2. 基于最小点距离的IoU度量

原论文中受水平矩形的几何特性启发，设计了一种基于最小点距离的新型IoU度量MPDIoU，直接最小化预测边界框和真实边界框的左上角和右下角点之间的距离。
MPDIoU的计算通过两个任意凸形状 $A$ 和 $B$ ，用其左上角和右下角点的坐标来表示，通过计算两个框的交集与并集之比，再减去左上角和右下角两点距离的归一化值来得到MPDIoU。

2.3. 作为边界框回归损失函数

在训练阶段，通过最小化基于MPDIoU的损失函数 $L_{MPDIoU}=1-MPDIoU$ ，使模型预测的每个边界框 $B_{prd}$ 接近其真实框 $B_{gt}$ 。
现有损失函数中的所有因素（如非重叠区域、中心点距离、宽高偏差等）都可以通过左上角和右下角两点的坐标确定，这意味着提出的 $L_{MPDIoU}$ 不仅考虑了这些因素，还简化了计算过程。

在这里插入图片描述

2.4 MPDIoU的计算公式

MPDIoU的计算公式：
- $MPDIoU=\frac{A\cap B}{A\cup B}-\frac{d_{1}^{2}}{w^{2}+h^{2}}-\frac{d_{2}^{2}}{w^{2}+h^{2}}$
- 其中 $A$ 和 $B$ 是两个任意凸形状， $x_{A1}, y_{A1})$ ， $x_{A2}, y_{A2})$ 表示(A)的左上角和右下角点坐标， $x_{B1}, y_{B1})$ ， $x_{B2}, y_{B2})$ 表示 $B$ 的左上角和右下角点坐标。
- $d_{1}^{2}=(x_{1}^{B}-x_{1}^{A})^{2}+(y_{1}^{B}-y_{1}^{A})^{2}$ ， $d_{2}^{2}=(x_{2}^{B}-x_{2}^{A})^{2}+(y_{2}^{B}-y_{2}^{A})^{2}$ 。
基于MPDIoU的损失函数计算公式：
- $L_{MPDIoU}=1-MPDIoU$ 。

三、添加步骤

3.1 ultralytics/utils/metrics.py

此处需要查看的文件是ultralytics/utils/metrics.py

metrics.py中定义了模型的损失函数和计算方法，我们想要加入新的损失函数就只需要将代码放到这个文件内即可

将下方的bbox_iou函数替换原本的bbox_iou函数即可：

def bbox_iou(box1, box2, xywh=True, GIoU=False, DIoU=False, CIoU=False, MDPIoU=False, feat_h=640, feat_w=640, eps=1e-7):
    # Returns Intersection over Union (IoU) of box1(1,4) to box2(n,4)

    # Get the coordinates of bounding boxes
    if xywh:  # transform from xywh to xyxy
        (x1, y1, w1, h1), (x2, y2, w2, h2) = box1.chunk(4, -1), box2.chunk(4, -1)
        w1_, h1_, w2_, h2_ = w1 / 2, h1 / 2, w2 / 2, h2 / 2
        b1_x1, b1_x2, b1_y1, b1_y2 = x1 - w1_, x1 + w1_, y1 - h1_, y1 + h1_
        b2_x1, b2_x2, b2_y1, b2_y2 = x2 - w2_, x2 + w2_, y2 - h2_, y2 + h2_
    else:  # x1, y1, x2, y2 = box1
        b1_x1, b1_y1, b1_x2, b1_y2 = box1.chunk(4, -1)
        b2_x1, b2_y1, b2_x2, b2_y2 = box2.chunk(4, -1)
        w1, h1 = b1_x2 - b1_x1, b1_y2 - b1_y1 + eps
        w2, h2 = b2_x2 - b2_x1, b2_y2 - b2_y1 + eps

    # Intersection area
    inter = (torch.min(b1_x2, b2_x2) - torch.max(b1_x1, b2_x1)).clamp(0) * \
            (torch.min(b1_y2, b2_y2) - torch.max(b1_y1, b2_y1)).clamp(0)

    # Union Area
    union = w1 * h1 + w2 * h2 - inter + eps

    # IoU
    iou = inter / union
    if CIoU or DIoU or GIoU:
        cw = torch.max(b1_x2, b2_x2) - torch.min(b1_x1, b2_x1)  # convex (smallest enclosing box) width
        ch = torch.max(b1_y2, b2_y2) - torch.min(b1_y1, b2_y1)  # convex height
        if CIoU or DIoU:  # Distance or Complete IoU https://arxiv.org/abs/1911.08287v1
            c2 = cw ** 2 + ch ** 2 + eps  # convex diagonal squared
            rho2 = ((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2 + (b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4  # center dist ** 2
            if CIoU:  # https://github.com/Zzh-tju/DIoU-SSD-pytorch/blob/master/utils/box/box_utils.py#L47
                v = (4 / math.pi ** 2) * torch.pow(torch.atan(w2 / h2) - torch.atan(w1 / h1), 2)
                with torch.no_grad():
                    alpha = v / (v - iou + (1 + eps))
                return iou - (rho2 / c2 + v * alpha)  # CIoU
            return iou - rho2 / c2  # DIoU
        c_area = cw * ch + eps  # convex area
        return iou - (c_area - union) / c_area  # GIoU https://arxiv.org/pdf/1902.09630.pdf
    elif MDPIoU:
        d1 = (b2_x1 - b1_x1) ** 2 + (b2_y1 - b1_y1) ** 2
        d2 = (b2_x2 - b1_x2) ** 2 + (b2_y2 - b1_y2) ** 2
        mpdiou_hw_pow = feat_h ** 2 + feat_w ** 2
        return iou - d1 / mpdiou_hw_pow - d2 / mpdiou_hw_pow  # MPDIoU
    return iou  # IoU

在这里插入图片描述

3.2 修改ultralytics/utils/loss.py

utils\loss.py用于计算各种损失。

在BboxLoss函数内修改如下代码，使模型调用此MPDIoU损失函数。


iou = bbox_iou(pred_bboxes[fg_mask], target_bboxes[fg_mask], xywh=False, MDPIoU=True)

在这里插入图片描述

3.3 修改ultralytics/utils/tal.py

tal.py中是一些损失函数的功能应用。

在iou_calculation函数内修改如下代码，使模型调用此MPDIoU损失函数。

return bbox_iou(gt_bboxes, pd_bboxes, xywh=False, MPDIoU=True).squeeze(-1).clamp_(0)

在这里插入图片描述

四、成功运行截图

在这里插入图片描述

原文地址：https://blog.csdn.net/qq_42591591/article/details/142818471

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Excel插件：成绩统计排名（三）
下一篇：【GUI】PyQt6 和 Qt6：深入对比与选择指南

设计模式之---工厂模式
抽象工厂模式主要用于创建相关对象的家族。当一个产品族中需要被设计在一起工作时，通过抽象工厂模式，能够保证客户端始终只使用同一个产品族中的对象；并且通过隔离具体类的生成，使得客户端不需要明确指定具体生成
阅读更多2024-10-11
Jetson 开发系列：离线低延迟的人脸识别方案
上篇调研了`语音识别和语音合成`解决方案。本篇继续探索`人脸识别`的离线部署方案。
阅读更多2024-10-11
【Linux系统编程】第三十弹---软硬链接与动静态库的深入探索
见一见软硬链接，软硬链接的特征，什么是软硬链接，软硬链接有什么用，什么是动静态库~~~
阅读更多2024-10-11
智能EDA小白从0开始 —— DAY10 Yosys
Yosys的工作原理深入来讲，是一个复杂但有序的硬件设计自动化流程，其核心在于将高级硬件描述语言（HDL）如Verilog或VHDL编写的代码，通过一系列精细的步骤转换为门级网表。这一流程首先涉及对H
阅读更多2024-10-11
wasm在云原生领域的运用
Wasm 最初是以浏览器安全沙盒为目的开发的，发展到目前为止，WebAssembly 已经成为一个用于云原生软件组件的高性能、跨平台和多语言软件沙箱环境，Wasm 轻量级容器也非常适合作为下一代无服务
阅读更多2024-10-11
基于vue的酒店预订管理系统（源码+定制+开发）
博主介绍： ✌我是阿龙，一名专注于Java技术领域的程序员，全网拥有10W+粉丝。作为CSDN特邀作者、博客专家、新星计划导师，我在计算机毕业设计开发方面积累了丰富的经验。同时，我也是掘金、华为云、
阅读更多2024-10-11
C++20主要特性
C++20 极大地丰富了C++语言，提供了更多的现代化编程工具和性能优化，使得C++成为一个更加强大和灵活的编程语言。其他改进：还包括了其他一些小的语言改进和标准库增强，如对文件系统的支持、数学库的
阅读更多2024-10-11
【ShuQiHere】重新定义搜索：本体搜索引擎的时代
**本体搜索引擎（Ontological Search Engine, OSE）** 是一种基于语义理解和本体结构的智能搜索工具。与传统的关键词搜索不同，本体搜索引擎能够理解搜索背后的深层语义，提供更
阅读更多2024-10-11
汽车3d动效的作用！云渲染实现3d动效
4、全渠道营销：3D汽车动效可以集成到线下和线上的营销平台中，如展厅、数字标牌、网站、社交媒体和电视广告，通过利用逼真和身临其境的可视化设计，营销人员可以有效地展示汽车的设计、功能和性能。5、智能化交
阅读更多2024-10-11
2024年网络安全进阶手册：三个月黑客技术自学路线
网络安全可以基于攻击和防御视角来分类，我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。走安全行业的工程方向的，技术上面其实有很大的重叠
阅读更多2024-10-11

YOLOv11改进策略【损失函数篇】| 利用MPDIoU，加强边界框回归的准确性

一、背景

文章目录

二、原理

2.1 IoU计算原理

2.2. 基于最小点距离的IoU度量

2.3. 作为边界框回归损失函数

2.4 MPDIoU的计算公式

三、添加步骤

3.1 ultralytics/utils/metrics.py

3.2 修改ultralytics/utils/loss.py

3.3 修改ultralytics/utils/tal.py

四、成功运行截图

相关文章