【混淆矩阵】Confusion Matrix！定量评价的基础！如何计算全面、准确的定量指标去衡量模型分类的好坏？？

🕗 发布于 2024-09-20 21:53 矩阵分类线性代数 深度学习 python

【混淆矩阵】Confusion Matrix！定量评价的基础！

如何计算全面、准确的定量指标去衡量模型分类的好坏？？

文章目录

【混淆矩阵】Confusion Matrix！定量评价的基础！
1. 混淆矩阵
2.评价指标
3.混淆矩阵及评价指标的实现（Python代码示例）
4.多分类问题中的评价指标
5.总结

在深度学习的分类问题中，二分类和多分类的结果常用混淆矩阵（Confusion Matrix）来呈现。此外，还有许多评价指标用于衡量模型性能，比如精度（Accuracy）、查准率（Precision）、召回率（Recall）、F1值等。

1. 混淆矩阵

对于二分类问题，混淆矩阵通常是一个 $2 \times 2$ 的矩阵：
在这里插入图片描述

TP（True Positive）: 预测为正类，且实际为正类。
FP（False Positive）: 预测为正类，但实际为负类。
FN（False Negative）: 预测为负类，但实际为正类。
TN（True Negative）: 预测为负类，且实际为负类。

对于多分类问题，混淆矩阵的维度为 $n \times n$ ，其中 $n$ 是类别数量。每个元素 $C_{ij}$ 表示实际类别 $i$ 被预测为类别 $j$ 的次数。

2.评价指标

精度（Accuracy）
精度是所有预测正确的比例，计算公式为：
查准率（Precision）
查准率衡量的是模型在预测为正类的样本中，实际为正类的比例：
召回率（Recall）
召回率衡量的是在所有实际为正类的样本中，模型能正确预测为正类的比例：
F1值（F1-Score）
F1值是 Precision 和 Recall 的调和平均数，用来平衡查准率和召回率：
特异度（Specificity）
特异度衡量的是在所有实际为负类的样本中，模型能正确预测为负类的比例：
ROC曲线与AUC
ROC曲线: 以假正率（FPR）为横轴，真正率（TPR，即召回率）为纵轴的曲线。
AUC（Area Under Curve）: ROC曲线下的面积，表示模型分类能力。
FPR 公式为：

3.混淆矩阵及评价指标的实现（Python代码示例）

import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix, accuracy_score, precision_score, recall_score, f1_score, roc_curve, auc
import seaborn as sns

# 模拟真实标签和预测标签
y_true = [0, 1, 1, 0, 1, 0, 1, 0, 0, 1]
y_pred = [0, 0, 1, 0, 1, 0, 1, 1, 0, 1]

# 计算混淆矩阵
cm = confusion_matrix(y_true, y_pred)
print("Confusion Matrix:\n", cm)

# 混淆矩阵的可视化
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.show()

# 计算各项评价指标
accuracy = accuracy_score(y_true, y_pred)
precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)

print(f'Accuracy: {accuracy}')
print(f'Precision: {precision}')
print(f'Recall: {recall}')
print(f'F1 Score: {f1}')

# 计算并绘制ROC曲线
fpr, tpr, thresholds = roc_curve(y_true, y_pred)
roc_auc = auc(fpr, tpr)
plt.plot(fpr, tpr, color='blue', label=f'AUC = {roc_auc:.2f}')
plt.plot([0, 1], [0, 1], 'r--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.0])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve')
plt.legend(loc="lower right")
plt.show()

4.多分类问题中的评价指标

在多分类问题中，Precision、Recall 和 F1值可以通过**微平均（micro average）和宏平均（macro average）**来计算：

微平均：对所有类的 TP、FP、FN 求和后再计算指标。
宏平均：分别计算每个类别的 Precision、Recall 和 F1，然后取平均。
你可以通过 average 参数在 sklearn 的 Precision_score、Recall_score 和 F1_score 中选择不同的方式：

# 多分类示例
y_true_multi = [0, 1, 2, 1, 2, 0, 1, 2, 0, 1]
y_pred_multi = [0, 2, 1, 1, 2, 0, 1, 2, 0, 2]

# 计算宏平均和微平均
precision_macro = precision_score(y_true_multi, y_pred_multi, average='macro')
precision_micro = precision_score(y_true_multi, y_pred_multi, average='micro')

print(f'Macro Average Precision: {precision_macro}')
print(f'Micro Average Precision: {precision_micro}')

5.总结

混淆矩阵提供了一个直观的工具来查看模型的预测效果。
评价指标如精度、查准率、召回率、F1值等用于量化模型性能。
多分类问题中，可以使用宏平均和微平均来评价模型在多个类别上的表现。

原文地址：https://blog.csdn.net/gaoxiaoxiao1209/article/details/142211574

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Orchestrator 与 Mysql 8.0 的兼容性
下一篇：蓝桥杯-STM32G431RBT6（解决LCD与LED引脚冲突的问题）

【网络安全】Cookie SameSite属性
严格限制可能会影响用户体验，例如，当用户点击 GitHub 链接时，无法保持登录状态，因为此时会丢失 GitHub 的 Cookie。当浏览器加载该图片时，它会向 A.com 发送带有 Cookie
阅读更多2024-11-16
【C语言】实现二维数组按行排序
【C语言】实现二维数组按行排序
阅读更多2024-11-16
NLP开发常见问题
NLP开发常见问题
阅读更多2024-11-16
在spring boot工程中使用Filter时，@WebFilter 注解不生效的问题分析和解决方案
如果要使用@WebFilter进行过滤路径的配置，则需要在启动类中添加@ServletComponentScan注解启用Servlet容器扫描@WebFilter注解，并删除Filter类中的@Com
阅读更多2024-11-16
天天学编程Day16
在 C++ 中，常量表达式（Constant Expression）是指在编译期就能计算出结果的表达式。其结果在程序运行过程中是不可改变的，并且这个结果必须是编译时常量，例如整数常量、枚举常量、用常量
阅读更多2024-11-16
消失的数字（c语言实现）
方法一我们使用异或操作符实现。介绍一下^操作符性质就是首先0^a=a；a^a=0;然后异或操作符还满足交换律。比如a ^ b ^ c ^a= a ^ a ^b ^c;我们可以通过这样的性质实现这个代
阅读更多2024-11-16
机器学习——期末复习重点题归纳
机器学习期末复习
阅读更多2024-11-16
opencv kdtree & pcl kdtree 效率对比
由于项目中以一个环节需要使用kdtree ,对性能要求比较严苛，所以看看那个kdtree效率高一些。对比了opencv和pcl。
阅读更多2024-11-16
Qt 5.6.3 手动配置 mingw 环境
手动设置 qt mingw 编译环境
阅读更多2024-11-16
IntelliJ IDEA 2024.3（Ultimate Edition）免费化教学
一款由 JetBrains 公司开发的集成开发环境 (Integrated Development Environment, IDE)，主要用于 Java 语言的软件开发，但它也支持其他多种编程语言和
阅读更多2024-11-16

【混淆矩阵】Confusion Matrix！定量评价的基础！如何计算全面、准确的定量指标去衡量模型分类的好坏？？