决策树
2019-01-09 13:51:47 126 举报
AI智能生成
决策树是一种常见的机器学习算法,它通过一系列规则来进行决策。每个节点代表一个特征或属性,每个分支代表一个判断条件,每个叶节点代表一个预测结果。决策树可以用于分类和回归问题,其优点是易于理解和解释,能够处理非线性关系和缺失值。但是,决策树容易过拟合,需要剪枝来避免这个问题。此外,决策树的计算复杂度较高,对于大规模数据集可能需要较长时间来训练模型。
作者其他创作
大纲/内容
决策树的优点
易于理解和解释
只需很少的数据准备
即可以处理数值型数据也可以处理类别型 数据
使用白箱 模型.
可以通过测试集来验证模型的性能
强健控制
可以很好的处理大规模数据
决策树扩展
决策图
决策树剪枝
CART
ID3算法
C4.5算法
决策树的类型
分类树
回归树
装袋算法(Bagging)
随机森林(Random Forest)
提升树(Boosting Tree)
旋转森林(Rotation forest)
ID3算法
C4.5算法
决策树的缺点
训练一棵最优的决策树是一个完全NP问题
决策树创建的过度复杂会导致无法很好的预测训练集之外的数据
有些问题决策树没办法很好的解决
对那些有类别型属性的数据, 信息增益 会有一定的偏置。
模型表达式
基尼不纯度指标
信息增益
0 条评论
下一页