pytorch 的交叉熵函数,多分类，二分类

🕗 发布于 2024-11-23 06:21 pytorch 分类 人工智能

多分类

在PyTorch中，交叉熵损失函数主要用于多类分类问题。PyTorch提供了两个交叉熵损失函数：`nn.CrossEntropyLoss` 和 `nn.NLLLoss` 与 `nn.LogSoftmax` 的组合。

### 1. `nn.CrossEntropyLoss`

`nn.CrossEntropyLoss` 是一个组合损失函数，它结合了 `nn.LogSoftmax` 和 `nn.NLLLoss`。这个损失函数期望输入（通常是模型的原始输出，即logits）和目标（ground truth labels）。

- **输入**：模型的原始输出（logits）和目标标签。
- **目标**：目标标签，通常是类的索引。

使用示例：

```python
import torch
import torch.nn as nn

# 假设有3个样本，每个样本有5个类别，模型输出的logits形状为[3, 5]
logits = torch.tensor([[1.0, 2.0, 3.0, 4.0, 5.0],
[1.0, 2.0, 3.0, 4.0, 5.0],
[1.0, 2.0, 3.0, 4.0, 5.0]])

# 真实标签，每个样本一个标签
labels = torch.tensor([1, 0, 4])

# 创建交叉熵损失函数
criterion = nn.CrossEntropyLoss()

# 计算损失
loss = criterion(logits, labels)

print(loss)
```

### 2. `nn.NLLLoss` 和 `nn.LogSoftmax`

如果你想要更细粒度的控制，可以使用 `nn.LogSoftmax` 和 `nn.NLLLoss` 分别对logits进行softmax转换和计算负对数似然损失。

- **`nn.LogSoftmax`**：对输入应用log-softmax函数。
- **`nn.NLLLoss`**：计算负对数似然损失。

使用示例：

```python
import torch
import torch.nn as nn
import torch.nn.functional as F

# 假设有3个样本，每个样本有5个类别，模型输出的logits形状为[3, 5]
logits = torch.tensor([[1.0, 2.0, 3.0, 4.0, 5.0],
[1.0, 2.0, 3.0, 4.0, 5.0],
[1.0, 2.0, 3.0, 4.0, 5.0]])

# 真实标签，每个样本一个标签
labels = torch.tensor([1, 0, 4])

# 应用log-softmax
log_softmax = nn.LogSoftmax(dim=1)
log_probs = log_softmax(logits)

# 创建负对数似然损失函数
nll_loss = nn.NLLLoss()

# 计算损失
loss = nll_loss(log_probs, labels)

print(loss)
```

这两种方法都可以用于计算交叉熵损失，选择哪一种取决于你的具体需求和偏好。`nn.CrossEntropyLoss` 更为方便，因为它将两个步骤合并为一步，而 `nn.NLLLoss` 和 `nn.LogSoftmax` 的组合则提供了更多的灵活性。

二分类

loss = -torch.trace(torch.matmul(y, torch.log(output).float().t()) + torch.matmul((1 - y), torch.log(1 - output).float().t())) # 计算损失函数和这个区别呢

您提供的代码行：

```python
loss = -torch.trace(torch.matmul(y, torch.log(output).float().t()) +
torch.matmul((1 - y), torch.log(1 - output).float().t()))
```

这是一个自定义的二元分类交叉熵损失函数的实现。它与PyTorch提供的`nn.CrossEntropyLoss`和`nn.NLLLoss`+`nn.LogSoftmax`的组合有以下不同：

1. **输入要求不同**：
- `nn.CrossEntropyLoss`接受原始输出（logits）和类别索引作为目标（target）。它内部会先应用`nn.LogSoftmax`，然后计算负对数似然损失（NLL）。
- 您提供的代码同样接受原始输出（logits）和真实标签（y），但它期望`y`是0和1的二元标签，并且直接计算对数似然，没有应用softmax函数。

2. **计算方式不同**：
- `nn.CrossEntropyLoss`和`nn.NLLLoss`+`nn.LogSoftmax`的组合首先对logits应用softmax函数，然后对每个类别的概率取对数，最后计算负对数似然损失。
- 您的代码直接对输出（`output`）取对数，没有经过softmax转换。这意味着您的代码假设`output`是概率值（即经过sigmoid函数处理的结果），而不是logits。因此，它直接计算了每个样本的对数似然损失，并且通过`torch.matmul`和`torch.trace`来计算整个批次的损失。

3. **损失计算的细节**：
- `nn.CrossEntropyLoss`在内部处理了多类别的情况，并且可以处理多维的输出，其中每一维对应一个类别的概率。
- 您的代码是为二元分类设计的，它通过`y`和`(1 - y)`来区分两个类别，并且只计算了两个类别的对数似然损失。

4. **数值稳定性**：
- `nn.CrossEntropyLoss`和`nn.LogSoftmax`的组合由于先进行softmax转换，通常具有更好的数值稳定性。
- 直接对概率值取对数可能会遇到数值问题，尤其是当概率值接近0或1时。

总结来说，您的代码是一个为二元分类问题定制的交叉熵损失函数，它直接对概率输出取对数，而PyTorch的`nn.CrossEntropyLoss`和`nn.NLLLoss`+`nn.LogSoftmax`的组合则提供了更通用的解决方案，适用于多类别问题，并且具有更好的数值稳定性。

原文地址：https://blog.csdn.net/zhangfeng1133/article/details/143959412

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：安装支持ssl的harbor 2.1.4 docker 19.03.8 docker-compose 1.24.0
下一篇：django+boostrap实现发布博客权限控制

C# LINQ（Language Integrated Query）详解
LINQ（语言集成查询）是C#和.NETFramework中的一项强大功能，它使开发人员可以在代码中使用类似SQL的查询语法，操作内存中的数据集合（如数组、列表、集合等），而不必依赖SQL语句。LIN
阅读更多2025-01-21
JAVA-IO模型的理解（BIO、NIO）
本文主要介绍了关于网络中的几种IO模型，以及每种模型的介绍和概念等，包括非阻塞模型中select，poll，epoll的介绍
阅读更多2025-01-21
Java-数据结构-二叉树(配图详解)
之前我们学习的顺序表(ArrayList)和链表(LinkedList)都是线性表也就都是线性的数据结构，而树则是一种非线性的数据结构，它由有限个结点组成一个具有层次关系的集合，之所以将它叫做&quo
阅读更多2025-01-21
从前端视角看设计模式之结构型模式篇
上篇介绍了设计模式之创建型模式，接下来介绍设计模式之结构型模式，这些模式关注对象之间的组合和关系，旨在解决如何构建灵活且可复用的类和对象结构
阅读更多2025-01-21
excel实用工具
excel工具
阅读更多2025-01-21
ThinkPHP 8的多对多关联
多对多关联属于比较复杂的关联，需要借助一个中间表实现，在模型中使用belongsToMany定义。在介绍ThinkPHP8的多对多语法之间，我们先来看一个例子，以加深对多对多关联的理解。比如我们开发一
阅读更多2025-01-21
【FPGA】MIPS 12条整数指令【1】
实现bgtz、bltz、jalr
阅读更多2025-01-21
STM32-CAN总线
CAN总线是由BOSCH公司开发的一种简洁易用、传输速度快、易扩展、可靠性高的串行通信总线。
阅读更多2025-01-21
【Golang 面试题】每日 3 题（三十八）
📚专栏简介：在这个专栏中，我将会分享Golang面试中常见的面试题给大家~
阅读更多2025-01-21
Acwing-基础算法课笔记之基础算法（二分）
然后将27与mid下标所在的数做比较，如果27<a[mid]，则将指针right更新，如果27>a[mid]，则将指针left更新，最终找到目标数。需要定义两个变量，一个left，一个ri
阅读更多2025-01-21

pytorch 的交叉熵函数,多分类，二分类

多分类

二分类

相关文章