pandas
2016-08-24 11:15:01 0 举报
AI智能生成
登录查看完整内容
Pandas是一个开源的Python数据分析库,提供了大量的数据处理和分析功能。它是基于NumPy构建的,可以方便地处理结构化数据,如表格、时间序列等。Pandas提供了两种主要的数据结构:Series和DataFrame。Series是一维数组,适用于存储一维数据;而DataFrame是二维表格,适用于存储多维数据。Pandas提供了丰富的数据操作方法,如数据筛选、排序、合并、分组等,同时还支持对数据进行统计分析、可视化等操作。此外,Pandas还具有强大的性能和灵活的扩展性,可以与其他Python库(如Matplotlib、Seaborn等)无缝集成,广泛应用于金融、医疗、科研等领域。
作者其他创作
大纲/内容
e
DataFrame
赋值形式
源于Series字典
源于N维数组
子主题
源于已有结构
源于元祖的字典
\u00A0 \u00A0 \u00A0 \u00A0a \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 \u00A0 b \u00A0 \u00A0 \u00A0\u00A0 \u00A0 \u00A0 \u00A0a \u00A0 \u00A0 \u00A0 \u00A0 b \u00A0 \u00A0 \u00A0 c \u00A0 \u00A0 \u00A0 a \u00A0 \u00A0 \u00A0 \u00A0 bA B \u00A04.0 \u00A0 \u00A0 1.0 \u00A0 \u00A0 5.0 \u00A0 \u00A08.0 \u00A0 \u00A0 \u00A010.0\u00A0 \u00A0 C \u00A03.0 \u00A0 \u00A0 2.0 \u00A0 \u00A0 6.0 \u00A0 \u00A07.0 \u00A0 \u00A0 \u00A0NaN\u00A0 \u00A0 D \u00A0NaN \u00A0NaN \u00A0NaN \u00A0NaN \u00A0 9.0
它的固有属性
DataFrame.index \u00A0行名\u00A0
DataFrame.columns 列名
DataFrame.value 内部的值
初步处理函数
DataFrame.describe(),计算简单的统计特性
DataFrame.T 转置
DataFrame.sort()以某一列排序,默认从小到大
切片
DataFrame['X'],X为列名
1.DataFrame[0:n] 取第一到第N行2.DataFrame['行名':'行名'],取2行之间所有行
逻辑选择
数字
DataFrame[表达式],表达式可以是应用在整个DataFrame上的ex:DataFrame[DataFrame>1]找出数据框内所有大于1的数DataFrame[DataFrame.A>1]找出A列大于1的
非数字
缺省值处理
DataFrame.dropna(how='any')
DataFrame.fillna('值')用值填缺省DataFrame.fillna(method=\"ffill\"/'bfill')用前值/后DataFrame.fillna({列:值,列:值})
numpy.nan
对数据框应用函数(对一列或者一行,通过axis控制)
要求:函数的参数必须是一个array
形式:DataFrame.apply(函数名)
合并
Concat(列排列)
merge(类似SQL的JOIN)
append(将一行连接到一个DataFrame上)
result = df1.append(df2)
分组执行
Reshape(个人倾向于叫分类)
透视表
时间序列
时间表示
时间聚合
http://www.cnblogs.com/prpl/p/5537417.html 函数相对全
Series
形式
data内数据类型
Python字典
N维数组
标量
引用角度
可以用数组的方式引用
也可以用字典的方式引用
数学操作
加减乘除是矩阵形式的操作而非传统的字符数组拼接
统计相同值个数
Series.value_counts()
ol class=\"linenums\" style=\
应用
pd.value_counts(df["E"]),统计个数
df.describe()
筛选
1 df[(df.A >= -1) & (df.B <= 0)] # 值筛选2 df[df.E.str.contains(">")] # 包含某个字符,contains筛选的其实是正则表达式3 df[df.F.isin(['1'])] # 在列表内
采样
0 条评论
回复 删除
下一页