数据分析步骤1-1
2022-03-30 22:53:37 0 举报
AI智能生成
数据分析步骤,有需要的直接克隆就可以,后续还有更改环节.
作者其他创作
大纲/内容
提出问题
理解数据
采集数据
导入数据
导入文件
数据合并
查看数据信息
数据清洗
数据预处理
1.选择子集
2.列重命名
3.缺失值处理
删除
填充
缺失值为数值类型:平均值替代
缺失值为分类类型:众数填充或U填充
4.数据类型转换/一致化处理
直接循环
分割再转换
5.数据排序
6.异常值处理:【querySer=saleDf.loc[:,'销售数量']>1salesDf.loc[querySer,:]
(重复值处理)
特征工程
特征提取
数值类型
时间序列
分类数据
有直接类别的数据
需从字符串中提取特征
特征选择
计算各特征与标签的相关系数
查看各特征与标签的相关系数排序
构建模型
建立训练数据集和测试数据集
选择机器学习算法
训练模型
评估模型准确度
用模型进行预测
数据可视化
具体工作任务与完成情况
按时间
按项目
亮点与不足
工作亮点
工作不足
改进措施
个人方面
团队协作方面
下一阶段工作计划
自由主题
0 条评论
下一页