可视化处理-数据清洗
2023-04-14 21:26:31 0 举报
AI智能生成
可视化处理-数据清洗
作者其他创作
大纲/内容
质量五维度
数据一致性、精确性、完整性
时效性和实体同一性
清洗手段
缺失值填充
均值填充法、回归填充法、就近填充法......
缺失值是数值型—平均值
缺失值是非数值型—众数
平滑噪声
存储的值被分布到一些“桶”或箱中,
平滑各个分箱中的数据
平滑各个分箱中的数据
平均数平滑、中位数平滑、箱边界平滑
分箱、移动平均、聚类去除噪声数据
识别和去除离群点
不一致性检测与修复
实体识别与真值发现
0 条评论
下一页