Padans
2022-01-06 17:49:54 0 举报
Python-Padans
作者其他创作
大纲/内容
基本用法汇总
DataFrame的创建
创建一个空的dataframe
用list的数据创建dataframe
用numpy的矩阵创建dataframe
用dict的数据创建DataFrame
读取csv或者excel文件为DataFrame格式
DataFrame的一些描述和类型
head会显示dataframe的前几行,后几行
单独计算某列的统计值
查看dataframe的数据类型
查看dataframe的数据数目
查看dataframe的形状
返回维度
DataFrame的切片
iloc索引或切片
iloc中只能取整数值
loc索引或切片
loc中可以取str
缺失值的处理
缺失值可以删除也可以用均值或者0等数填充
删除缺失值时可以指定列
去重、删除行或列
去除有NaN值的行或列(axis=0去除行,=1去除列)
去除某一列
去除含有某一个数的行
DataFrame的修改
修改数据类型
修改列名(需要写上所有列名,包括需要修改的和不需要修改的)
修改列名(只需写上需要修改的列)
修改数据
用已有的列进行运算创建新的列
重排序(by可以取多个列名,默认升序)
df = df.sort_values(by=['one'],ascending = True)
dataframe更改索引
当删除掉不需要的行时,行索引会变的不连续,这时候可以重新设计新的索引
设置时间序列为索引
添加新的行,将两个dataframe连接到一起
连接后行数是以前的2倍,列数不变
如果两个dataframe的列名是一样的,也可以用merge
在dataframe添加新的行
DataFrame的输出
输出为excel或者csv格式,csv文件里的数据被读取时数据类型默认为object,excel则会保留原有的数据类型
输出为numpy的矩阵格式
输出为dict格式
0 条评论
下一页
为你推荐
查看更多
抱歉,暂无相关内容