决策树之 ID3 算法
2016-06-22 12:58:49 0 举报
ID3算法是一种决策树学习算法,由Ross Quinlan于1986年提出。它的目标是通过计算信息增益来选择最佳的划分属性,从而构建一棵泛化能力强、预测准确率高的决策树。ID3算法的核心思想是:每次选择一个最优的属性作为划分属性,使得各个子集中的样本尽可能地属于同一类别,从而提高分类的准确性。ID3算法具有简单、直观、易于实现等优点,但也存在一些局限性,如对连续属性的处理能力较弱、容易产生过拟合等问题。尽管如此,ID3算法仍然是决策树领域的一个重要基石,为后续决策树算法的发展奠定了基础。
作者其他创作
大纲/内容
Strong
计算各个属性下的分支信息熵Entropy( Ti )
计算当前信息熵Entropy( S )
Normal
Humidity
No
Yes
根据分支信息熵计算条件熵Entropy( S|T )
Overcast
计算特征属性 T1 的信息增益IG( T1 )
Sunny
Rainy
data
. . .
计算特征属性 Tn 的信息增益IG( Tn )
计算特征属性 T0 的信息增益IG( T0 )
Wind
Weather
OutLook
ID3 决策树构建过程(局部)
High
Weak
选择最信息增益最大的特征属性为决策节点加入决策树
0 条评论
下一页