1、算法描述
ID3算法是以信息熵下降速度作为选取测试属性的标准的,决策树生成算法。
信息熵的下降速度用信息增益度来衡量其定义是:
定义1:若存在n个相同概率的消息,则每个消息的概率p是1/n,一个消息传递的信息量为Log2(1/n)
定义2:若有n个消息,其给定概率分布为P=(p1,p2…pn),则由该分布传递的信息量称为P的熵,记为
参考文档和完整的文档和源码下载地址:
https://www.write-bug.com/article/2293.html