DecisionTree
2016-10-05 15:31:09 0 举报
决策树(Decision Tree)是一种监督学习算法,主要用于分类和回归任务。它通过递归地分割数据集,根据特征值的不同将数据划分为不同的类别或预测值。决策树的每个节点表示一个特征或属性,每个分支代表该特征的一个取值,而每个叶节点则表示最终的分类结果或预测值。决策树的主要优点是易于理解和解释,能够处理非线性关系,并且对于缺失值和异常值具有较好的鲁棒性。然而,决策树也容易过拟合,尤其是在数据集较小或特征较多的情况下。为了解决过拟合问题,可以采用剪枝、随机森林等技术对决策树进行优化。
作者其他创作
大纲/内容
输入训练集D以及属性集A
结束
根据划分点生成两条分支,数据集划分
生成节点
否
是
为每个取值v生成一条分支,数据集划分
从属性集中去掉a*
从A中选取最优划分属性a*
开始
D在预测属性上属于同一类别C
A已经为空或者D中所有样本在A上取值相同
a*是否是连续属性
生成叶节点,类别标记为样本数最多的类
是否存在取值为v的数据
对于每条分支,重复划分步骤
0 条评论
下一页