python模块
2018-08-20 16:57:13 0 举报
AI智能生成
python常用模块(未完成版)
作者其他创作
大纲/内容
random模块
模块名称:random
导入方法:import random
导入方法:import random
常用方法
random.random() # 大于0且小于1之间的小数
0.7664338663654585
0.7664338663654585
#随机整数
random.randint(1,5) # 大于等于1且小于等于5之间的整数
random.randrange(1,10,2) # 大于等于1且小于10之间的奇数
random.randint(1,5) # 大于等于1且小于等于5之间的整数
random.randrange(1,10,2) # 大于等于1且小于10之间的奇数
#随机选择一个返回
random.choice([1,'23',[4,5]]) # #1或者23或者[4,5]
#随机选择多个返回,返回的个数为函数的第二个参数
random.sample([1,'23',[4,5]],2) # #列表元素任意2个组合
[[4, 5], '23']
random.choice([1,'23',[4,5]]) # #1或者23或者[4,5]
#随机选择多个返回,返回的个数为函数的第二个参数
random.sample([1,'23',[4,5]],2) # #列表元素任意2个组合
[[4, 5], '23']
#打乱列表顺序
item=[1,3,5,7,9]
random.shuffle(item) # 打乱次序
item
[5, 1, 3, 7, 9]
random.shuffle(item)
item
[5, 9, 7, 1, 3]
item=[1,3,5,7,9]
random.shuffle(item) # 打乱次序
item
[5, 1, 3, 7, 9]
random.shuffle(item)
item
[5, 9, 7, 1, 3]
生成随机验证码
import random
def func(n = 6):
a = ''
for i in range(n):
num = str(random.randint(0,9))
alpha = chr(random.randint(97,122))
alpha_A = chr(random.randint(65,90))
ret = random.choice([num,alpha,alpha_A])
a += ret
return a
print(func())
def func(n = 6):
a = ''
for i in range(n):
num = str(random.randint(0,9))
alpha = chr(random.randint(97,122))
alpha_A = chr(random.randint(65,90))
ret = random.choice([num,alpha,alpha_A])
a += ret
return a
print(func())
sys模块
模块名称:sys
导入方法:import sys
导入方法:import sys
常用方法
sys.argv
命令行参数List,第一个元素是程序本身路径
sys.exit(n)
退出程序,正常退出时exit(0),错误退出sys.exit(1)
sys.version
获取Python解释程序的版本信息
sys.path
返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform
返回操作系统平台名称
sys.modules
子主题
序列化模块
json模块
模块名称:json
导入方法:import json
导入方法:import json
常用方法
json.dumps()
序列化:将一个字典转换成一个字符串
import json
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = json.dumps(dic) #序列化:将一个字典转换成一个字符串
print(type(str_dic),str_dic) #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
#注意,json转换完的字符串类型的字典中的字符串是由""表示的
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = json.dumps(dic) #序列化:将一个字典转换成一个字符串
print(type(str_dic),str_dic) #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
#注意,json转换完的字符串类型的字典中的字符串是由""表示的
json.loads()
反序列化:将一个字符串格式的字典转换成一个字典
dic2 = json.loads(str_dic) #反序列化:将一个字符串格式的字典转换成一个字典
#注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
print(type(dic2),dic2) #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
#注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
print(type(dic2),dic2) #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
json.dump()
dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
import json
f = open('json_file','w')
dic = {'k1':'v1','k2':'v2','k3':'v3'}
json.dump(dic,f) #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
f.close()
f = open('json_file','w')
dic = {'k1':'v1','k2':'v2','k3':'v3'}
json.dump(dic,f) #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
f.close()
json.load()
load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
f = open('json_file')
dic2 = json.load(f) #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
f.close()
print(type(dic2),dic2)
dic2 = json.load(f) #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
f.close()
print(type(dic2),dic2)
ensure_ascii=False关键字参数
import json
f = open('file','w')
json.dump({'国籍':'中国'},f)
ret = json.dumps({'国籍':'中国'})
f.write(ret+'\n')
json.dump({'国籍':'美国'},f,ensure_ascii=False)
ret = json.dumps({'国籍':'美国'},ensure_ascii=False)
f.write(ret+'\n')
f.close()
f = open('file','w')
json.dump({'国籍':'中国'},f)
ret = json.dumps({'国籍':'中国'})
f.write(ret+'\n')
json.dump({'国籍':'美国'},f,ensure_ascii=False)
ret = json.dumps({'国籍':'美国'},ensure_ascii=False)
f.write(ret+'\n')
f.close()
pickle模块
pickle.dumps()
序列化:将一个字典转换成一串二进制内容
import pickle
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = pickle.dumps(dic)
print(str_dic) #一串二进制内容
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = pickle.dumps(dic)
print(str_dic) #一串二进制内容
pickle.loads()
反序列化:将一个二进制格式的字典转换成一个字典
dic2 = pickle.loads(str_dic)
print(dic2)
print(dic2)
time模块
模块名称:time
导入方法:import time
导入方法:import time
常用方法
time.sleep(secs)
(线程)推迟制定的时间运行.单位为秒
(线程)推迟制定的时间运行.单位为秒
time.time()
获取当前时间戳
获取当前时间戳
表示时间的三种方
在Python中,通常有这
三种方式来表示时间:
时间戳、元组(struct_time)、
格式化的时间字符串
在Python中,通常有这
三种方式来表示时间:
时间戳、元组(struct_time)、
格式化的时间字符串
时间戳(timestamp):
通常来说,时间戳表示的是从1970年1月1日 00:00:00
开始按秒计算的偏移量.我们运行"type(time.time())",
返回的是float类型.
通常来说,时间戳表示的是从1970年1月1日 00:00:00
开始按秒计算的偏移量.我们运行"type(time.time())",
返回的是float类型.
time.time()
1500875844.800804
1500875844.800804
格式化的时间字符串(Format String):
%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身
%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身
time.strftime("%Y-%m-%d %X")
'2017-07-24 13:54:37'
>>>time.strftime("%Y-%m-%d %H-%M-%S")
'2017-07-24 13-55-04'
'2017-07-24 13:54:37'
>>>time.strftime("%Y-%m-%d %H-%M-%S")
'2017-07-24 13-55-04'
元组(struct_time):
struct_time元组共有9个元素:(
年,月.日,分,秒,一年中第几周,一
年中第几天等)
struct_time元组共有9个元素:(
年,月.日,分,秒,一年中第几周,一
年中第几天等)
#时间元组:localtime将一个时间戳转换为当前时区的struct_time
time.localtime()
time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24,
tm_hour=13, tm_min=59, tm_sec=37,
tm_wday=0, tm_yday=205, tm_isdst=0)
time.localtime()
time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24,
tm_hour=13, tm_min=59, tm_sec=37,
tm_wday=0, tm_yday=205, tm_isdst=0)
三种格式之间的转换
#时间戳-->结构化时间
#time.gmtime(时间戳) #UTC时间,与英国伦敦当地时间一致
#time.localtime(时间戳) #当地时间。例如我们现在在北京执行这个方法:与UTC时间相差8小时,UTC时间+8小时 = 北京时间
>>>time.gmtime(1500000000)
time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=2, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0)
>>>time.localtime(1500000000)
time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=10, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0)
#time.gmtime(时间戳) #UTC时间,与英国伦敦当地时间一致
#time.localtime(时间戳) #当地时间。例如我们现在在北京执行这个方法:与UTC时间相差8小时,UTC时间+8小时 = 北京时间
>>>time.gmtime(1500000000)
time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=2, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0)
>>>time.localtime(1500000000)
time.struct_time(tm_year=2017, tm_mon=7, tm_mday=14, tm_hour=10, tm_min=40, tm_sec=0, tm_wday=4, tm_yday=195, tm_isdst=0)
#结构化时间-->时间戳
#time.mktime(结构化时间)
>>>time_tuple = time.localtime(1500000000)
>>>time.mktime(time_tuple)
1500000000.0
#time.mktime(结构化时间)
>>>time_tuple = time.localtime(1500000000)
>>>time.mktime(time_tuple)
1500000000.0
#结构化时间-->字符串时间
#time.strftime("格式定义","结构化时间") 结构化时间参数若不传,则显示当前时间
>>>time.strftime("%Y-%m-%d %X")
'2017-07-24 14:55:36'
>>>time.strftime("%Y-%m-%d",time.localtime(1500000000))
'2017-07-14'
#time.strftime("格式定义","结构化时间") 结构化时间参数若不传,则显示当前时间
>>>time.strftime("%Y-%m-%d %X")
'2017-07-24 14:55:36'
>>>time.strftime("%Y-%m-%d",time.localtime(1500000000))
'2017-07-14'
#字符串时间-->结构化时间
#time.strptime(时间字符串,字符串对应格式)
>>>time.strptime("2017-03-16","%Y-%m-%d")
time.struct_time(tm_year=2017, tm_mon=3, tm_mday=16, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=75, tm_isdst=-1)
>>>time.strptime("07/24/2017","%m/%d/%Y")
time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=0, tm_yday=205, tm_isdst=-1)
#time.strptime(时间字符串,字符串对应格式)
>>>time.strptime("2017-03-16","%Y-%m-%d")
time.struct_time(tm_year=2017, tm_mon=3, tm_mday=16, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=75, tm_isdst=-1)
>>>time.strptime("07/24/2017","%m/%d/%Y")
time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=0, tm_yday=205, tm_isdst=-1)
#结构化时间 --> %a %b %d %H:%M:%S %Y串
#time.asctime(结构化时间) 如果不传参数,直接返回当前时间的格式化串
>>>time.asctime(time.localtime(1500000000))
'Fri Jul 14 10:40:00 2017'
>>>time.asctime()
'Mon Jul 24 15:18:33 2017'
#time.asctime(结构化时间) 如果不传参数,直接返回当前时间的格式化串
>>>time.asctime(time.localtime(1500000000))
'Fri Jul 14 10:40:00 2017'
>>>time.asctime()
'Mon Jul 24 15:18:33 2017'
#时间戳 --> %a %b %d %H:%M:%S %Y串
#time.ctime(时间戳) 如果不传参数,直接返回当前时间的格式化串
>>>time.ctime()
'Mon Jul 24 15:19:07 2017'
>>>time.ctime(1500000000)
'Fri Jul 14 10:40:00 2017'
#time.ctime(时间戳) 如果不传参数,直接返回当前时间的格式化串
>>>time.ctime()
'Mon Jul 24 15:19:07 2017'
>>>time.ctime(1500000000)
'Fri Jul 14 10:40:00 2017'
os模块
模块名称:os
导入方法:import os
导入方法:import os
文件操作
可生成多层递归目录
os.makedirs('dirname1/dirname2'
若目录为空,则删除,
并递归到上一级目录,
如若也为空,则删除,
依此类推
并递归到上一级目录,
如若也为空,则删除,
依此类推
os.removedirs('dirname1')
生成单级目录
os.mkdir('dirname')
删除单级空目录,若目录不为空则无法删除,报错
os.rmdir('dirname')
列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.listdir('dirname')
删除一个文件
os.remove()
重命名文件/目录
os.rename("oldname","newname")
获取文件/目录信息
os.stat('path/filename')
os.path
返回path规范化的绝对路径 os.path.split(path)
将path分割成目录和文件名二元组返回
将path分割成目录和文件名二元组返回
os.path.abspath(path)
返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.dirname(path)
返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。
即os.path.split(path)的第二个元素
即os.path.split(path)的第二个元素
os.path.basename(path)
如果path存在,返回True;如果path不存在,返回False
os.path.exists(path)
如果path是绝对路径,返回True
os.path.isabs(path)
如果path是一个存在的文件,返回True。否则返回False
os.path.isfile(path)
如果path是一个存在的目录,则返回True。否则返回False
os.path.isdir(path)
将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.join(path1[, path2[, ...]])
返回path所指向的文件或者目录的最后访问时间
os.path.getatime(path)
返回path所指向的文件或者目录的最后修改时间
os.path.getmtime(path)
返回path的大小
os.path.getsize(path)
统计文件夹大小
递归版
import os
def func(path): # r'D:\sylar\s15'
size_sum = 0
name_lst = os.listdir(path)
for name in name_lst:
path_abs = os.path.join(path,name)
if os.path.isdir(path_abs):
size = func(path_abs)
size_sum += size
else:
size_sum += os.path.getsize(path_abs)
return size_sum
ret = func(r'D:\sylar\s15')
print(ret)
def func(path): # r'D:\sylar\s15'
size_sum = 0
name_lst = os.listdir(path)
for name in name_lst:
path_abs = os.path.join(path,name)
if os.path.isdir(path_abs):
size = func(path_abs)
size_sum += size
else:
size_sum += os.path.getsize(path_abs)
return size_sum
ret = func(r'D:\sylar\s15')
print(ret)
for循环版
import os
lst = [r'D:\sylar\s15',] # 列表的第一个目录就是我要统计的目录
size_sum = 0
while lst: # [r'D:\sylar\s15',] lst = ['D:\sylar\s15\day01','D:\sylar\s15\day01'..]
path = lst.pop() # path = 'D:\sylar\s15' lst = []
path_list = os.listdir(path) # path_list = ['day01',day02',aaa,day15.py]
for name in path_list: # name = day01
abs_path = os.path.join(path,name)
if os.path.isdir(abs_path): # 文件夹的逻辑
lst.append(abs_path) # lst.append('D:\sylar\s15\day01') lst = ['D:\sylar\s15\day01']
else:
size_sum += os.path.getsize(abs_path)
print(size_sum)
lst = [r'D:\sylar\s15',] # 列表的第一个目录就是我要统计的目录
size_sum = 0
while lst: # [r'D:\sylar\s15',] lst = ['D:\sylar\s15\day01','D:\sylar\s15\day01'..]
path = lst.pop() # path = 'D:\sylar\s15' lst = []
path_list = os.listdir(path) # path_list = ['day01',day02',aaa,day15.py]
for name in path_list: # name = day01
abs_path = os.path.join(path,name)
if os.path.isdir(abs_path): # 文件夹的逻辑
lst.append(abs_path) # lst.append('D:\sylar\s15\day01') lst = ['D:\sylar\s15\day01']
else:
size_sum += os.path.getsize(abs_path)
print(size_sum)
执行doc命令
执行字符串数据类型的操作系统命令
os.system()
执行字符串数据类型的操作系统命令,并返回结果
os.popen()
re模块
模块名称:re
导入方法:import re
导入方法:import re
常用方法
findall
匹配所有 每一项都是列表中的一个元素
import re
ret = re.findall('\d+','sjkhk172按实际花费928') # 正则表达式,带匹配的字符串,flag
ret = re.findall('\d','sjkhk172按实际花费928') # 正则表达式,带匹配的字符串,flag
print(ret)
ret = re.findall('\d+','sjkhk172按实际花费928') # 正则表达式,带匹配的字符串,flag
ret = re.findall('\d','sjkhk172按实际花费928') # 正则表达式,带匹配的字符串,flag
print(ret)
search
只匹配从左到右的第一个,得到的不是直接的结果,
而是一个变量,通过这个变量的group方法来获取结果
如果没有匹配到,会返回None,使用group会报错
而是一个变量,通过这个变量的group方法来获取结果
如果没有匹配到,会返回None,使用group会报错
import re
ret = re.search('\d+','sjkhk172按实际花费928')
print(ret) # 内存地址,这是一个正则匹配的结果
print(ret.group()) # 通过ret.group()获取真正的结果
ret = re.search('\d+','sjkhk172按实际花费928')
print(ret) # 内存地址,这是一个正则匹配的结果
print(ret.group()) # 通过ret.group()获取真正的结果
match
从头开始匹配,相当于search中的正则表达式加上一个^
import re
ret = re.match('\d+$','172sjkhk按实际花费928')
print(ret)
ret = re.match('\d+$','172sjkhk按实际花费928')
print(ret)
split
切割
s = 'alex83taibai40egon25'
ret = re.split('\d+',s)
print(ret)
ret = re.split('\d+',s)
print(ret)
sub/subn
替换
import re
# sub # 谁 旧的 新的 替换次数
ret = re.sub('\d+','H','alex83taibai40egon25')
print(ret)
ret = re.sub('\d+','H','alex83taibai40egon25',1)
print(ret)
# subn 返回一个元组,第二个元素是替换的次数
ret = re.subn('\d+','H','alex83taibai40egon25')
print(ret)
# sub # 谁 旧的 新的 替换次数
ret = re.sub('\d+','H','alex83taibai40egon25')
print(ret)
ret = re.sub('\d+','H','alex83taibai40egon25',1)
print(ret)
# subn 返回一个元组,第二个元素是替换的次数
ret = re.subn('\d+','H','alex83taibai40egon25')
print(ret)
正则表达式
元字符:
匹配所有的数字
\d
匹配数字,字母,下划线
/w
匹配所有的空白符 回车/换行符 制表符 空格
/s
匹配换行符
/n
匹配制表符
/t
表示单词的边界
/b
匹配除了数字,字母,下划线以外的所有字符
/W
匹配除了数字以外的所有字符
\D
匹配除了空白符 回车 换行符 制表符 空格以外的所有内容
\S
匹配一个字符串的开始
^
匹配一个字符串的结束
$
匹配除换行符之外的所有字符
.
出现在中括号内的内容都可以被匹配
[]
只要不出现在中括号中的内容都可以被匹配
[^]
"或" 符合a规则或者符合b规则的都可以被匹配
(ps:将更复杂的/更长的规则写在最前面)
(ps:将更复杂的/更长的规则写在最前面)
a|b
分组 表示给几个字符加上量词约束的需求的时候,就给这些量词分在一个组
()
量词:
表示这个量词之前的字符出现n次
{n}
表示这个量词之前的字符至少出现n次
{n,}
表示这个量词之前的字符出现n-m次
{n,m}
表示匹配量词之前的字符出现 0次 或者 1次
?
表示匹配量词之前的字符出现 1次 或者 多次
+
表示匹配量词之前的字符出现 0次 或者 多次
*
进阶:节省时间/空间
节省时间:compile
ret = re.compile('\d+') # 已经完成编译了
print(ret)
res = ret.findall('alex83taibai40egon25')
print(res)
res = ret.search('sjkhk172按实际花费928')
print(res.group())
print(ret)
res = ret.findall('alex83taibai40egon25')
print(res)
res = ret.search('sjkhk172按实际花费928')
print(res.group())
节省空间:finditer
import re
ret = re.finditer('\d+','alex83taibai40egon25')
for i in ret:
print(i.group())
ret = re.finditer('\d+','alex83taibai40egon25')
for i in ret:
print(i.group())
博客园
0 条评论
下一页