使用python对信息熵进行计算

使⽤python对信息熵进⾏计算
在机器学习中的决策树类算法中主要依靠信息熵的⼤⼩来选择重要的特征属性作为节点换分数据集从⽽获得训练结果
谁是人类的祖先#-*-coding:utf-8-*-
from math import log
import operator
def calcShanonEnt(dataSet):
'''
计算给定数据集的⾹农熵
九把刀北大演讲:param dataSet:
:return:shanonEnt
'''
名人电子词典numEntries = len(dataSet)
labelCounts={}
for featVec in dataSet:
currentLabel = featVec[-1]
if currentLabel not in labelCounts.keys():
余姚labelCounts[currentLabel]=0
labelCounts[currentLabel] +=1
shanonEnt = 0.0
for key in labelCounts:
prob= float(labelCounts[key])/numEntries
shanonEnt -= prob*log(prob,2)
越南国民党
文章与人品return shanonEnt
作者:WangB

本文发布于:2024-09-22 12:46:09,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/204372.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   节点   集从   决策树
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议