分类任务中,一个模型的好坏,可以有很多评价指标,本文将系统介绍混淆矩阵,和常见的几种评价指标。
混淆矩阵
混淆矩阵是机器学习中经常用来总结模型预测结果的表,用n*n的矩阵表示,即将数据集中的元素个数,按真实和预测两个维度进行汇总。以二分类为例,混淆矩阵结构如下:
TP(True Positive) | FN(False Negative)
FP(False Positive) | TN(True Negative)
解释说明
TP:表示实际正,预测正
FP:表示实际负,预测正
FN:表示实际正,预测负
TN:表示实际负,预测负
真实正样本:TP+FN,真实负样本:FP+TN
预测正样本:TP+FP,预测负样本:TN+FN
评价指标
1、准确率
分类正确的样本数量,占总样本个数的比例,可以理解为被正确分类的样本比例。
Accuracy = TP+TN/N
最简单直观的评价指标,但样本不均衡时,会受占比大的类别影响。比如正负比例9:1,模型什么都不做,直接将所有样本预测为正,准确率也能到90%。
2、精准率
预测为正实际也为正的样本数量,占预测为正的样本数量的比例。
Precision = TP/(TP+FP)
Precision体现了模型对负样本的区分能力,Precision越高,模型对负样本的区分能力越强。
3、召回率
预测为正实际也为正的样本数量,占实际为正的样本数量的比例,直观理解就是找到所有正样本的能力。
Recall = TP/(TP+FN)
Recall体现了模型对正样本的识别能力,Recall越高,模型对正样本的识别能力越强。
4、F1 Score
精准率和召回率的调和平均值。
F1 = 2/(1/Precision + 1/Recall)
F1 Score是Precision和Recall的综合,F1 Score越高,说明模型越稳健。
简单示例
假设有10个样本,其真实和预测值如下:
L:0 0 0 1 0 1 0 1 1 0
P:0 1 0 1 1 0 0 1 0 1
混淆矩阵
2(TP) | 2(TN)
3(FP) | 3(FN)
指标计算
Accuracy = (2+3)/10 = 1/2
Precision = 2/(2+3) = 2/5
Recall = 2/(2+2) = 1/2
本文为 陈华 原创,欢迎转载,但请注明出处:http://ichenhua.cn/read/287
- 下一篇:
- 机器学习模型评估之ROC曲线和AUC