利用互信息比较不同的聚类结果

利⽤互信息⽐较不同的聚类结果
互信息(mutual information)和信息熵(information entropy)⼀样都是信息论⾥⾯的概念。信息熵在决策树⾥⾯⽤的⽐较多,可以度量样本集合的纯度。⽽互信息在聚类中有很⼤的作⽤,它可以衡量对同⼀个数据集不同的划分的之间的相似程度。
周菊英
假设表⽰数据集上的两个不同的划分,包括n的样本。穿孔机
包含个簇,= {}。
包含个簇,= {}。辽宁医学院护理学院
表⽰和中相同样本的个数。
表⽰中样本的个数,表⽰中样本的个数。
软件管理系统的互信息为:
接下来还要对进⾏标准化,使的值域为
甲乙酮标准化的互信息⽤表⽰:
其中 分别表⽰ 的信息熵
威海地税的值介于0到1之间,当划分 只有很⼩的差别时, 趋近于1,反之趋近于0。
如果我们通过先验信息,知道了真正的划分,那么就可以⽤来检验划分是否合理。

本文发布于:2024-09-22 08:32:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/435610.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:划分   互信息   样本   数据   概念   标准化
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议