(笔记)Kappa系数混淆矩阵

（笔记）Kappa系数混淆矩阵

遥感图像的分类解译结果往往需要⼀定的精度评价指标进⾏精度验证，只有进⾏精度验证，我们才能知道分类解译的结果是否准确可靠。Kappa系数就经常被⽤于影像分类的空间⼀致性检验，是⼀种衡量分类精度的指标。

Section 1：Kappa系数的概念

Kappa系数是⼀个⽤于⼀致性检验的指标，也可以⽤于衡量分类的效果。

在分类问题中，⼀致性就是指模型的预测结果和实际分类结果是否⼀致。

Kappa系数的计算是基于混淆矩阵的，取值为-1到1之间，通常⼤于0。

基于混淆矩阵的Kappa系数计算公式如下：

其中：

中医美容论文

P0实际上就是准确率（Accuracy）

pgr

丁宗皓即所有类别分别对应的“实际数量与预测数量的乘积”之和，除以“样本总数的平⽅”。

Section 2：为什么要使⽤Kappa系数

在分类问题中，最常见的评价指标是准确率（Accuracy），准确率能直接反应分类正确的⽐例，同时准确率的计算⾮常简单。

但是在实际的分类问题数据集中，各个类别的样本数量往往不太平衡。

对于这种存在类别不平衡问题的数据集，如果不加以调整，模型很容易偏向⼤类别⽽放弃⼩类别。

例如：数据集中正负样本⽐例为1:9，即使模型直接全部预测为负，准确率（Accuracy）也有90%，但这样正样本就完全被抛弃了。

虽然此时整体的准确率（Accuracy）很⾼，但是部分类别完全不能被召回。

这时就需要⼀种能够惩罚模型的“偏向性”的指标来代替准确率（Accuracy）。

⽽根据Kappa系数的计算公式，越不平衡的混淆矩阵，pe越⾼，Kappa值就越低，正好可以给“偏向性”强的模型打低分。

Section 3：Kappa系数计算⽰例

混淆矩阵：

Section 4：Kappa系数的指标解释

Kappa系数的计算结果位于[-1,1]，但通常Kappa系数是落在[0,1]之间。

Kappa系数的结果可以分为五组来表⽰不同级别的⼀致性：

0.00到0.20：极低的⼀致性（Slight）

0.21到0.40：⼀般的⼀致性（Fair）

0.41到0.60：中等的⼀致性（Moderate）

戈登模型0.61到0.80：⾼度的⼀致性（Substantial）

0.81到1.00：⼏乎完全⼀致（Almost Perfect）

Link：江口涣

Section 5：混淆矩阵

混淆矩阵（Confusion Matrix）⼜称误差矩阵（Error Matrix），是ROC曲线绘制的基础，同时它也是衡量分类模型准确度中最基本，最直观，计算最简单的⽅法。

混淆矩阵的简单解释就是：分别统计分类模型归错类，归对类的观测值个数，然后把结果放在⼀个表⾥展⽰出来，这个表就是混淆矩阵。

Link：kappa系数

本文发布于:2024-09-20 17:53:47，感谢您对本站的认可！

标签：分类结果模型

留言与评论（共有 0 条评论）