分类问题的评价指标：超越准确率

展开混淆矩阵、精确率、召回率、F1分数和ROC曲线

在本文中，我们将讨论为什么准确率并不总是评估模型性能的最佳指标，特别是在分类任务的情况下，然后我们将介绍替代指标，以更好地了解我们的分类器的表现如何。我们还将通过示例来更好地理解这些指标的思想，以及何时使用哪些指标。但在正式讨论之前，让我们首先确保我们对一些基础知识有很好的了解。

监督机器学习可以广泛分为两种类型：回归和分类。

回归：在回归中，模型的目标是预测连续值，例如基于输入特征（如大小、卧室数量、地区等）预测房屋价格。

分类：它涉及基于输入特征预测离散类别标签。一些分类的例子包括电子邮件垃圾检测、疾病检测、图像分类等。

由于在回归问题中，我们的目标值（我们想要预测的值称为目标）是连续的，所以使用均值绝对误差（MAE）、均方误差（MSE）、R-平方等指标是完全合理的。这些指标需要计算每个实例的实际值和预测值之间的差异（也称为误差或残差）。

然而，在分类中目标值通常是分类的，计算这种数学指标是不合适的。因此，我们需要其他指标来量化分类模型的性能，准确率就是其中之一。

评估我们的分类器最简单、最直接的方法之一是看它正确分类的实例比例。我们可以通过将正确预测的数量除以数据集中的总实例数来做到这一点。这就是准确率 – 就这么简单！