python
2019-11-25 18:00:46 0 举报
AI智能生成
Python知识图
作者其他创作
大纲/内容
numpy
读取数据
numpy.genfromtxt(\"文件名\
帮助文档
help(numpy.genfromtxt)
help(numpy.array)
数组
DataFrame变成numpy array
data['foo'].values
对数组进行操作
bool类型数组作为索引
打印数组结构(作用:查错)
vetor.shape
(维数,个数)
.shape[0/1]:0 行,1 列
注意
切片
vetor[0:3]
左闭右开,即取0到2
矩阵
类型转换
.astype(T)
求和
.sum(axis=1)
生成矩阵
矩阵转换
形成矩阵
.ravel
把矩阵拆解成向量
T
行列转换位置
矩阵拼接
横拼接
竖拼接
把矩阵扩展为原矩阵的行列的倍数
矩阵切分
指定具体切分位置
0值矩阵
1值矩阵
API
获得维度
.ndim
数据类型
.dtype.name
大小
size
生成数据
numpy.arange()
.arange(n)
随机生成n个数
生成从i开始到j结束,每k递增的数组
从0开始到j结束,中间平均生成k个值
随机
运算
四则运算
矩阵积
.dot
常用方法
exp(m)
e的次幂
sqrt
开根号
floor
向下取整
合并
复制操作
深复制
a=b
深复制,id一样,指向内存同一位置
浅复制
.view()
id不一样,指向不是同一位置,但是共用同一套values
.copy()
位置不同而且值也不共用
索引
.argmax(axis=1/0)
按行/列,找最大值的索引
排序
.argsort(v)
有小到大获得索引
Matplotlib
导入
import matplotlib.pyplot as plt
IO
plot(x轴,y轴)
show
显示方式
x轴文字显示方向
plt.xticks(rotation=45)
标题
画颜色线和标记线
找出画图区间
fig = plt.figure()
子图
柱状图
竖状
ax = plt.subplot()
例子
水平状
散点图
ax.scatter()
柱形图
盒图
Python
Data
转化矩阵
randMat = mat(x)
零矩阵
zeros()
变量
打印类型
type()
写入文件
span style=\
f = open(\"datingTestSet.txt\"span class=\"s1\
读取文件
Output
方法
map()
map()函数接收两个参数,一个是函数,一个是序列,map将传入的函数依次作用到序列的每个元素,并把结果作为新的list返回。
循环
for value in list
顺序循环:for i in range(n)
从0到n-1
if value in list
while 判断条件:
if else
if 判断条件:else 判断条件:
from numpy import array
String
去回车
line.strip()
切割
表格
line.split('\\t')
返回数组
转换
p style=\
str()
int()
float()
符号
**
list
必需声明
value = []
添加元素:append()
长度:len()
Array
Python下标是以0开始的x[1:3]表示返回集合中下标1至3(不包括3)的元素集合
随机生成数组
[-1]表示最后一个,[-1]:最后一个
字典
dic={}
dic[\"key\"]=value
dic={\"key1\
dic.keys()
\"key\" in dic:Bool
函数
def method():
逻辑操作符
&与
|或
别名
as
Pandas(数据分析处理库)
数据类型:DataFrame
String在Pandas中是object
重新拼接
按列拼接
设置index
read_csv(file name)
不读取第一行
.read_csv(\"test.cvs\
显示
.head()
表格显示,默认显示前5条
.tail()
从后显示
.colums
显示列名
取列
vector[\"列名\"]
打印全部列名
定位
.loc[n]
ix
以上说过的几种方法都要求查询的秩在索引中,或者位置不超过长度范围,而ix允许你得到不在DataFrame索引中的数据。
[:1]
预处理
food_info.sort_values(\"Sodium_(mg)\
判断缺失值
age_is_null = pd.isnull(age)
过滤缺失值
good_ages = titanic_survival[\"Age\"][age_is_null == False]
自动过滤缺失值并求平均数
.mean()
dropna(axis=)
统计量关系(默认求均值)
一对一
passenger_survival = titanic_survival.pivot_table(index=\"Pclass\
一对多
port_stats = titanic_survival.pivot_table(index=\"Embarked\
new_titanic_survival = titanic_survival.sort_values(\"Age\
并重新排好序列
new_titanic_survival = titanic_survival.reset_index(drop=True)
自定义函数
apply(自定义函数名)
hundredth_row = titanic_survival_csv.apply(hundredth_row)
离散化
Series
DataFrame的一行或一列
自定义构造
string当索引
sorted_index = sorted(original_index)
np.sin(series_custom)
np.max(series_custom)
标准差
日期
unrate['DATE'] = pd.to_datetime(unrate['DATE'])
抽取月份
pd.to_datetime(unrate['DATE']).dt.month
数数
数一下Class的值
常用API
字符串
打印
\"{} is {}\
替换
剔除
剔除空格
strip()
剔除特定字符
strip('abc')
拆分
split
组合
'a'+'b'
计数字符在字符串中出现的次数
count
str[m:n]
查找字符出现位置
index(symbol)
找不到会报错
从固定位置查找
找不到返回-1
collection
dictionary
遍历
for k in dic
0 条评论
回复 删除
下一页