Ptython数据挖掘思维导图
2019-12-09 11:09:07 2 举报
Python数据挖掘思维导图
作者其他创作
大纲/内容
视为缺失值
数据特征分析
平稳
聚类分析
分布分析、对比分析、统计量分析、周期性分析、相关性分析、贡献度分析
平方、开方、取对数、差分运算,转换成正态分布的序列,或平稳序列
属性规约
结束
关联规则
Aprior
AR模型、MA模型、ARMA模型
属性构造
存在
删除记录
数据质量分析
贝叶斯网络
一致性
ID3、C4.5、CART、SLIQ、SPRINT、PUBLIC
Eclat算法
STING算法(统计信息网络)、CLIOUE算法(聚类高维空间)、WAVE-CLUSTER算法(小波变换)
基于网格的方法
数据清洗
max-min、零均值规范化、小数定标规范化
时序模式
数据变换
基于模型的方法
数据规约
是
K-Means算法(K-平均)、K-MEDOIDS算法(K-中心点)、CLARANS算法(基于选择的算法)
等宽法、等频法、基于聚类的方法
线性回归、非线性回归、Logistic回归、岭回归、主成分回归
不处理
平均值修正
解决实体识别与属性冗余问题
异常值
BIRCH算法(平衡迭代规约和聚类)、CURE算法(代表点聚类 )、CHAMELEON算法(动态模型)
数据预处理
数据集成
否
均值、中位数、固定值、回归插值法、拉格朗日、牛顿插值法等
平稳性检验1)时序图和自相关图;2)构造检验统计量
支持向量机
简单函数变换
数据插补
FP-Tree
基于密度的方法
回归分析
决策树
灰色关联法
小波变换
数据分析
人工神经网络
层次分析方法
规范化
纯随机性检验1)Q统计量、LB统计量
缺失值
通过属性合并实现数据降维、创新维度,常用方法有:合并属性、逐步向前选择、逐步向后删除、决策树归纳、主成分分析(PCA)、奇异值分解(SVD)
划分(分裂方法)
分类预测
BP神经网络、LM神经网络、RBF径向神经网络、FNN模糊神经网络、GMDH神经网络、ANFIS自适应神经网络
纯随机
连续属性离散化
ARIMA模型
挖掘建模
统计学方法、神经网络方法
不修正
收藏
0 条评论
下一页