# 混淆矩阵

混淆矩阵（Confusion Matrix）是评估分类模型性能的基础工具，它以矩阵形式展示分类结果，记录预测值与真实值的四种组合情况。

	预测正例	预测反例
真实正例	TP（真正例）	FN（假反例）
真实反例	FP（假正例）	TN（真反例）

其中：

# 核心评估指标

$Accuracy = \frac{TP+TN}{TP+TN+FP+FN}$

说明：准确率是指模型正确分类的样本数占总样本数的比例。

适用场景：

注意：在严重的类别不平衡问题中（如欺诈检测），单独使用准确率会产生误导。

$Precision = \frac{TP}{TP+FP}$

说明：精确率是指在模型预测为正例的样本中，真正为正例的比例。反映模型的 "准确性"。

适用场景：

示例：医生诊断患者患病，假如诊断为患病（正例）的患者中，实际患病的比例。

$Recall = \frac{TP}{TP+FN}$

说明：召回率是指在所有真实正例样本中，被正确预测出来的比例。反映模型的 "查全性"。

适用场景：

示例：在所有患病患者中，被医生正确诊断出来的比例。

$\begin{aligned} F1 &= 2 \times \frac{Precision \times Recall}{Precision + Recall} \\ &= \frac{2 \times TP}{2 \times TP+FP+FN} \end{aligned}$

说明：F1 值是精确率和召回率的调和平均数，同时考虑两者的平衡。取值范围为 $[0, 1]$ ，值越高越好。

适用场景：

ROC 曲线下的面积。
值域: 0.5 (随机猜测) 到 1.0 (完美模型)。
优点：对类别不平衡不敏感。