【第5章】数据整合和数据清洗
2019-01-28 14:37:36 0 举报
AI智能生成
第五章 数据整合和数据清洗
作者其他创作
大纲/内容
数据清洗
重复值处理
drop_duplicates
duplicated
缺失值处理
查看缺失情况
以指定值填补
缺失值指示变量
噪声值处理
盖帽法
分箱法
聚类法
数据整合
行列操作
选择单列
数据框ix、iloc、loc方法
ix
iloc
选择多行和多列
按索引的方式
iloc方式
创建、删除列
创建
直接列赋值
assign方法赋值
删除
drop方法
条件查询
单条件
多条件
其他
between
isin
contains
使用query
多条件查询
横向连接
内连接
merge
外连接
左连接
右连接
全连接
行索引连接
concat
纵向合并
全部连接
去重连接
缺失值连接
排序
示例
分组汇总
分组变量
汇总变量
汇总统计量
多重索引
拆分、堆叠列
拆分列
堆叠列
赋值与条件赋值
赋值
条件赋值
RFM方法在客户行为上的运用
行为特征提取的RFM方法论
最近一次消费(Recency)
消费频率(Frequency)
消费金额(Monetary)
使用RFM方法计算变量
数据整理与汇报
0 条评论
下一页