数据清理
2017-03-23 08:08:31 0 举报
AI智能生成
数据分析和数据清理方法
作者其他创作
大纲/内容
问题
数据质量不高,不便于阅读,不利于使用公式自动处理,难以进行分析
整理出格式规范,显示清晰,便于分析的数据
数据清理流程
了解用户需求,确定目标
确定数据表格框架
分析数据,确定清理方案
数据质量不高的常见问题
数据没有分列挤在一起
分析数据,找到分割规律,进行分拆
存在无效信息
删除、替换
复杂字符串,构造正则表达式匹配
简单重复,直接替换
字段不规整
所需信息分布在多列中需整合
连接整合
数据重复,不唯一
排序找到重复的模式
整理删除重复项
整理重构数据
根据反馈进行数据优化
使用教程
自由主题
0 条评论
下一页