机器学习流程
2023-04-23 17:35:00 0 举报
AI智能生成
流程
作者其他创作
大纲/内容
数据探索
可视化展示
通过matplotlib中的绘图工具进行可视化
热力图
分箱图
等等。。
数据质量检测
缺失值
异常值
数据特征分析
数据的分布探索
如:正态分布、指数分布等
常用统计量分析
如:均值、方差、最值(describe())
相关性分析
特征处理
数据清洗
缺失值处理
插补法
简单插补
插值插补/热平台插补
拟合插补
多重插补
异常值处理
异常值处理可参考缺失值处理
重复/错误值处理
参考缺失值插补
数据预处理
数据归一化/标准化
z标准化/min_max标准化
行归一化/范数归一化
对数变换/平滑处理
log:
smooth:
模型训练
由易到难
由独立到依存
重点构建集成算法
模型验证
评价指标
交叉验证
超参数调整
网格搜索(最常用)
贝叶斯调参
贪心调参
特征衍生&选择
合成适合模型的特征
类似CNN处理的特征?
特征组成
过滤/嵌入
方差选择法/相关系数法
正则化特征选取/树模型特征选取
降维
PCA
LDA
模型融合
Bagging
Boosting
Stacking
Stacking过程的周报总结
0 条评论
下一页