classification_report分类报告的含义

🕗 发布于 2024-12-08 04:34 分类数据挖掘 人工智能

基础知识

在这里插入图片描述

混淆矩阵（Confusion Matrix）

可以看出来类别之间相互误分的情况，查看是否有特定的类别相互混淆，能够帮我们调整后续模型，比如一些类别设置权重衰减。
在这里插入图片描述

精度（Precision）

precisoin即准确率，也称查准率。
精确率表示模型预测为正类别的样本中有多少是真正的正类别。
在这里插入图片描述

准确率（Accuracy）

正确分类的样本占总样本数的比例。
在这里插入图片描述

召回率（Recall）

recall是召回率，也称查全率
在所有实际为正类别的样本中，模型能够正确预测为正类别的比例。
在这里插入图片描述
高召回率意味着模型能够有效地捕捉到实际为正类别的样本。

与Precision的关系：负相关。

F1分数（F1-score）

F1 分数的取值范围是 [0, 1]，越接近 1 表示模型的性能越好，同时考虑到了模型在查准率和查全率之间的平衡。
在这里插入图片描述

示例1：

y_true = [1, 2, 3, 1, 2, 3, 1, 2, 3]
y_predicted = [1, 2, 3, 3, 2, 1, 3, 2, 3]


from sklearn.metrics import classification_report
print(classification_report(y_true, y_predicted))

输出结果：
在这里插入图片描述

可以加上target_names参数

效果如下：

print(classification_report(y_test, y_predicted, target_names=['a类', 'b类', 'c类']))

如图左边显示出了新传入的标签名。
在这里插入图片描述

示例2：

from sklearn.metrics import classification_report
Y_test=[0, 0, 0, 0, 0, 1, 1, 1, 1, 1]
Y_prediction=[0, 1, 0, 0, 0, 1, 1, 0, 0, 1]
print(classification_report(Y_test,Y_prediction))

输出结果：
得到该10个数据的二分类的分类报告：
在这里插入图片描述
先画个混淆矩阵：

给出了每类别对应的精度（Precision）、召回率（Recall）F1分数（F1-score）、真实中有多少个是该类别的（Support）、准确率（Accuracy）、宏平均（macro avg）和加权平均（weighted avg）。

Precision：预测为x的样本中，有多少被正确预测为x。
Precision_0=4/(2+4)=0.67
Precision_1=3/(3+1)=0.75

Recall：实际为x的类别中，有多少预测为x。
Recall_0=3/5=0.60
Recall_1=4/5=0.80

F1分数：2×Precision×Recall /(Precision+Recall)。

Accuracy：全部样本里被分类正确的比例。
Accuracy=7/10

macro avg：上面类别各分数的直接平均。
macro avg_precision=(0.67+0.75)/2=0.71

weighted avg：上面类别各分数的加权（权值为support）平均。
macro avg_precision=(0.675+0.755)/10=0.71

原文地址：https://blog.csdn.net/2301_81133727/article/details/144191252

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：php企业服务大师H5版本
下一篇：# issue 9 进程

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14