数据科学通用框架
2021-07-20 17:02:11 0 举报
AI智能生成
数据科学通用框架
作者其他创作
大纲/内容
特征工程
特征处理
特征清洗
清洗异常样本
采样
上采样/下采样
根据样本权重采样
单个特征
归一化
离散化
哑变量处理
数据变换
log
指数
Box-Cox
多个特征
降维
PCA
LDA
特征选择
Filter
Wrapper
Embedding
衍生变量
差分
有关系的多个特征之间的计算
特征监控
特征有效性分析
特征重要性分析
特征质量监控
数据分析/建模
探索性数据分析
汇总统计
描述性统计分析
均值
方差
中位数等
交叉分析
相关分析
列联表统计
数据可视化
柱形图
折线图
气泡图等
机器学习
无监督学习
聚类分析
Isomap
高斯混合模型
PCA
监督学习
Logistic Regression
Naive Bayes Classifier
Random Forest
SVM
Decision Tree
GBDT
LightGBM
强化学习
Q-learning
Policy Gradient
深度学习
卷积神经网络
循环神经网络
递归神经网络
需求定义
需求调查
了解数据
转化为数据问题
需求确认
数据获取
交易数据
运营数据
网页爬虫数据
图片
文本
视频
... ...
数据清洗
数据完整性检测
数据一致性验证
数据整合
重复数据、无效数据清洗
缺失数据处理
删除
填补
替代
爬虫填补
均值插补
K均值
拟合
回归
极大似然估计
多重插补
随机森林
衍生
虚拟变量
不处理
0 条评论
下一页