Focal Loss

🕗 发布于 2024-10-17 07:52 深度学习 人工智能 机器学习

Focal Loss

Kullback-Leibler Divergence（相对熵）
NLL Loss
Cross Entropy Loss
Balanced Cross Entropy Loss
Focal Loss
应用场景：
- - 1、车道检测与分类

Kullback-Leibler Divergence（相对熵）

KL散度（Kullback-Leibler Divergence，也称相对熵）用来衡量两个分布之间的偏差，其可以用下面数学公式描述：
$\begin{align} D_{KL}(p(x),q(x)) &= \sum_i^N p_i(x) \mathrm{log} \left(\frac{p_i(x)}{q_i(x)}\right)\\ &=\sum_i^N p_i(x) \mathrm{log}{p_i(x)}-p_i(x) \mathrm{log}{q_i(x)}\\ &= -H(p)+H(p,q) \end{align}$

NLL Loss

Cross Entropy Loss

上面公式中的 $CE (p, q)$ 即为交叉熵 (Cross-Entropy) 函数，通常在机器学习中， $p (x)$ 表示为目标分布（可以理解为label）， $q (x)$ 表示模型输出分布（可以理解为prediction），监督学习的目标是尽可能使得 $q (x)$ 接近 $p (x)$ 从而达到最佳性能，即 $q (x)$ 和 $p (x)$ 偏差越大，KL散度值越大，当两者分布相等时，KL散度为零，同时目标分布确定时 $p (x)$ 分布的熵 $H (p)$ 也是确定的，因此通过KL散度进行优化等价于通过交叉熵进行优化。
$CE\_loss(p,q)=- \sum_i^N p_i(x) \mathrm{log}{q_i(x)}$

如何计算交叉熵？

以二分类为例：这里有1个样本， $y$ 表示真实值， $\hat{y}$ 表示预测为1的概率值，

	$y$	$\hat{y}$
sample 1	0	0.1

$\begin{align} CE_{loss} &= -\left(0*\mathrm{log}(1-0.1) +1*\mathrm{log}(0.1) \right)\\ &= 2.3025 \end{align}$
使用代码验证如下：

import torch
import math
print(-(0*math.log(0.9)+1*math.log(0.1)))

BCE_loss = torch.nn.BCELoss()
target = torch.tensor([0]).float()
output = torch.tensor([0.9]).float()
print(BCE_loss(output, target))

同理，接入对于一个三分类（多分类）任务，一个样本的预测值为 $(0.1, 0.3, 0.6)$ ，其对应的 gt 为 (0, 0, 1)，则其交叉熵损失为： $- (l o g (1 - 0.1) + l o g (1 - 0.3) + l o g (0.6))$ ，但torch.nn.CrossEntropyLoss()的计算方式略显不同（它是 softmax+log+NLLLoss的合体）。

Balanced Cross Entropy Loss

在多类别数据中，如果某类别之间分布不均衡，直接训练会导致模型过多关注样本比例较多的类别，而在样本比例较少的类别上分类性能不足，因此Balanced Cross Entropy Loss提出是为了缓解这个问题，其根据每个类别在数据中的分布比例进行加权，数学表达式如下：
$BalnacedCE\_loss(p,q)=-\sum_i^N \alpha_i p_i(x) \mathrm{log}{q_i(x)}$

Focal Loss

尽管引入Balanced Cross Entropy Loss缓解了类别分布不均衡的问题，但模型对每种类别的分类能力往往是不同的，因此训练模型的时候就需要模型重点关注难分样本的特征，其数学表达式为：
$Focal\_loss(p,q)=-\sum_i^N \alpha_i(1- p_i(x))^{\gamma} \mathrm{log}{q_i(x)}$
其中 $\alpha_i$ 是类别均衡系数， $\gamma>0$ ，从公式中可以看到，当 $p_i(x) \longrightarrow 1$ 表明该样本被分类正确的概率越大，易区分样本，则其对应的loss所占的权重更低，反之则是难分类样本其loss权重更大。

应用场景：

1、车道检测与分类

原文地址：https://blog.csdn.net/weixin_50232758/article/details/142992153

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：RISC-V笔记——重叠地址排序
下一篇：LabVIEW提高开发效率技巧----图像处理加速

HCIP——以太网交换安全（四）&DHCP Snooping
以太网交换安全-DHCP Snooping
阅读更多2024-10-17
【Flutter】Dart：类
在 Dart 中，**类**（Class）是面向对象编程的核心概念之一，提供了一种封装数据和功能的方式。理解 Dart 中的类以及它的相关特性是开发 Flutter 应用的基础。本教程将深入介绍 Da
阅读更多2024-10-17
vae与ae的区别
为了更好地理解变分自编码器（VAE）和自编码器（AE）的区别，让我们通过一个具体的例子来说明。假设我们正在处理一个手写数字图像数据集，如 MNIST。
阅读更多2024-10-17
自动驾驶系列—自动驾驶系统监控平台：保障无人驾驶安全的幕后英雄
随着自动驾驶技术的发展，车辆不再依赖人类驾驶员操作，而是通过感知、决策和控制系统来实现自动驾驶。这一复杂的技术体系需要高度的实时监控，以确保车辆能够在各种环境中稳定、安全地运行。因此，自动驾驶系统监控
阅读更多2024-10-17
第六章元素应用CSS
CSS 提供属性来控制文本的字体类型。参数：字体名称按优先顺序排列，以逗号隔开。如果字体名称包含空格，则应用引号括起。说明：用 font-family 属性可控制显示字体。不同的操作系统，其字体名是不
阅读更多2024-10-17
PreCT-160K数据集：包含160K个CT体积的大规模医学图像预训练数据集，覆盖了100多种解剖结构。迄今为止最大规模的医学图像预训练数据集
2024-10-08，由香港科技大学的计算机科学与工程系创建了PreCT-160K，这是迄今为止最大规模的医学图像预训练数据集。该数据集包含了160K个CT体积，覆盖了100多种解剖结构，对于推动医学
阅读更多2024-10-17
kubekey的应用
KubeKey 是一个开源的轻量级工具，用于部署 Kubernetes 集群。它提供了一种灵活、快速、方便的方式来安装 Kubernetes/K3s、Kubernetes/K3s 和 KubeSphe
阅读更多2024-10-17
全面解析文档对象模型（DOM）及其操作(DOM的概念与结构、操作DOM节点、描述DOM树的形成过程、用DOMParser解析字符串为DOM对象）
文档对象模型（DOM）是Web开发中的核心概念，它提供了一种结构化的方法来表示和操作HTML和XML文档。通过DOM，开发者可以动态地访问和更新文档的内容、结构和样式。本文将深入探讨DOM的概念与结构
阅读更多2024-10-17
吴恩达深度学习笔记：卷积神经网络（Foundations of Convolutional Neural Networks）3.7-3.8
到目前为止你们学到的对象检测中的一个问题是，你的算法可能对同一个对象做出多次检测，所以算法不是对某个对象检测出一次，而是检测出多次。非极大值抑制这个方法可以确保你的算法对每个对象只检测一次，我们讲一个
阅读更多2024-10-17
leetcode——135.分发糖果
135.分发糖果
阅读更多2024-10-17

Focal Loss

Focal Loss

Kullback-Leibler Divergence（相对熵）

NLL Loss

Cross Entropy Loss

Balanced Cross Entropy Loss

Focal Loss

应用场景：

1、车道检测与分类

相关文章