Python 常用模块
阅读 (235712)一、time模块
-
名词
UTC(世界协调时间):格林尼治时间,世界标准时间,在中国为UTC+8DST(夏令时):是一种为了节约能源而人为规定地方时间的制度,一般在天亮早的夏季将时间提前一小时
-
时间的表示形式
-
时间戳
以整型或浮点型表示的是一个以秒为单位的时间间隔,这个时间的基础值是1970年1月1号零时开始算 -
元组
一种python的数据结构表示方式,这个元组有9个整数元素,分别表示不同的时间含义
year 年
month(1-12) 月
day(1-31) 日
hours(0-23) 时
minutes(0-59) 分
seconds(0-59) 秒
weekday(0-6,0表示星期一) 周
Julian day(1-366):表示当前日期在本年度是第几天
DST flag(-1 or 0 or 1):夏令时格式,0表示正常格式,1表示夏令时格式,-1表示根据当前的时间格式来判定 -
格式化字符串
格式化字符 含义 %a 本地简化星期名称 %A 本地完整星期名称 %b 本地简化月份名称 %B 本地完整月份名称 %c 本地相应的日期和时间表示 %d 一个月中的第几天(01-31) %H 一天中的第几个小时(24时制,00-23) %I 一天中的第几个小时(12时制,01-12 %j 一年中的第几天(001-366) %m 月份(01-12) %M 分钟数(00-59) %p 本地am或者pm的响应符号 %S 秒(00-59) %U 一年中的星期数,以星期日为一个星期 %w 一个星期中的第几天(0-6,0表示星期日) %W 和%U基本相同,以星期一为一个星期 %x 本地相应的日期 %X 本地相应的时间 %y 去掉世纪的年份(00-99) %Y 完整的年份 %Z 时区的名字,如果不存在为空字符串
-
-
导入
import time
-
方法
-
time()
返回当前时间的时间戳,无需参数,返回值为浮点型
t1 = time.time() print(t1)
-
gmtime([t])
将给定的时间戳转为UTC时间元组,如果没有参数默认转换当前时间戳
t2 = time.gmtime() print(t2)
-
localtime([t])
将给定的时间戳转为本地时间元组格式,如果没有参数默认转换当前时间戳
t3 = time.localtime() print(t3)
-
mktime(tt)
将本地时间元组转为时间戳
t4 = time.mktime(t3) print(t4)
-
asctime([tt])
将时间元组格式转为指定格式的字符串形式,如果没有参数默认使用localtime时间的时间元组
t5 = time.asctime(t3) print(t5, type(t5))
-
ctime([tt])
将时间戳格式转为指定格式的字符串形式,如果没有参数默认使用当前时间戳
t6 = time.ctime() print(t6)
-
strftime(format[, tt])
将时间元组以指定的格式转为字符串,如果没有tt参数默认使用当前本地时间元组
t7 = time.strftime("%Y-%m-%d %H:%M:%S", t3) print(t7)
-
strptime(st, format)
将指定格式的字符串解析为时间元组,是strftime的逆过程
注意:format表示的格式要与st一致
t8 = time.strptime("2001-10-01 08:08:08", "%Y-%m-%d %H:%M:%S") print(t8)
-
sleep()
延迟一个时间段,接收整型或者浮点型
time.sleep(2)
-
clock()
返回当前程序执行时间,Unix系统始终返回全部运行时间,而Windows系统从第二次开始都是以第一次调用此函数的时间戳为基准,而不是以程序开始的时间为基准
# windows Unix print(time.clock()) # 0 1 time.sleep(1) print(time.clock()) # 1 2 time.sleep(1) print(time.clock()) # 2 3
-
二、datetime模块
- 概述
datetime比time高级,可以理解为datetime基于time进行了封装,提供了更简单的函数接口,datetime模块的接口更直观、更容易调用
-
模块中的类
- time 只关注时间
- date 只关注日期
- datetime 同时关注日期和时间
- timedelta 主要用于计算时间跨度
- tzinfo 时区相关
-
导入
import datetime
-
方法
-
获取当前时间
t1 = datetime.datetime.now() print(t1, type(t1))
-
获取指定日期时间
t2 = datetime.datetime(2001, 10, 1, 8, 8, 8) print(t2)
-
将datetime时间转对象为字符串
t3 = t1.strftime("%X %x") print(t3, type(t3))
-
将字符串转为datetime对象
t4 = datetime.datetime.strptime(t3, "%X %x") print(t4, type(t4))
-
时间相减,返回一个时间间隔
t5 = datetime.datetime(2001, 10, 1, 8, 8, 8) t6 = datetime.datetime(2001, 10, 2, 9, 8, 9) t7 = t6- t5 print(t7, type(t7)) #获取时间间隔天数 print(t7.days) #获取去除间隔天数以外的间隔秒数 print(t7.seconds)
-
三、calendar模块
-
概述
日历模块
-
导入
import calendar
-
方法
-
返回指定年的某月
print(calendar.month(2019, 2))
-
返回指定年的日历
print(calendar.calendar(2018))
-
判断是否是闰年
print(calendar.isleap(2000))
-
返回某个月的weekday的第一天和这个月的所有天数
print(calendar.monthrange(2019, 4))
-
返回某一个月以一周为周期的元素序列
print(calendar.monthcalendar(2019, 2))
-
四、uuid模块
-
概述
是128位的全局唯一标识符,通常由32字节的字母串表示,它可以保证时间和空间的唯一性,也称为GUID
-
作用
随机生成字符串,在token、账号、订单号等需要唯一标识的地方使用
-
原理
通过Mac地址、时间戳、命名空间、随机数、伪随机数来保证产生的id的唯一性
-
算法:
-
uuid1()基于时间戳
有MAC地址、当前时间戳、随机数字,可以保证全球范围内的唯一性。但是由于MAC地址的使用会带来安全问题,局域网中可以使用IP来代替MAC -
uuid2()基于分布式计算环境DCE
算法和uuid1()相同,不同的是把时间戳的前4位换成POSI的UID,实际当中很少使用注意:python中没有这个函数
-
uuid3()基于名字和MD5散列值
通过计算名和命名空间的MD5散列值得到,保证了同一命名空间中不同名字的唯一性,和不同命名空间的唯一性,但是同一命名空间的相同名字生成相同的uuid -
uuid4()基于随机数
由伪随机数得到的,有一定的重复概率,这个重复概率是可以通过计算得到的 -
uuid5()基于名字和SHA1散列值
算法和uuid3()相同,不同的是使用SHA1算法
-
-
使用经验:
- python中没有基于DCE的,所以uuid2()可以忽略
- uuid4()存储概率性重复,由于无映射性所以最好不用
- 如果在全局的分布式环境下,最好使用uuid1()
- 若名字的唯一性要求,最好使用uuid3()或者uuid5()
-
导入
import uuid
-
使用
a = uuid.uuid1() print(a, type(a)) b = str(a) print(b, type(b)) # print(uuid.uuid2()) print(uuid.uuid3(uuid.NAMESPACE_DNS, "zutuanxue_com")) print(uuid.uuid3(uuid.NAMESPACE_DNS, "zutuanxue_com")) print(uuid.uuid3(uuid.NAMESPACE_OID, "zutuanxue_com")) print(uuid.uuid3(uuid.NAMESPACE_DNS, "zutuanxue_com")) print(uuid.uuid5(uuid.NAMESPACE_DNS, "zutuanxue_com"))
五、collections模块
-
概述
python中内建的一个集合模块,提供了许多有用的集合类
-
namedtuple
-
概述
命名元组,本质是一个函数,用他来创建一个自定义的tuple类型
规定tuple元素的格式,并可以用属性而不是索引引用tuple中的元素
用namedtuple实际上是创建一个新的数据类型
-
导入
from collections import namedtuple
-
使用
#假设这是一个点的坐标,但是没有写注释,时间久了就忘了该有含义 p = (1, 2) # 定义一个新的数据类型, Point = namedtuple("point", ["x", "y"]) # 定义一个Point类型的变量,保存一个元组数据 p2 = Point(1, 2) print(p2, isinstance(p2, Point), isinstance(p2, tuple)) #访问命名元组元素的值 print(p2[0], p2[1]) print(p2.x, p2.y)
-
-
deque
-
概述
使用list存储数据,按索引访问元素,但是插入和删除元素会根据元素的个数增多个降低效率。因为list是线性存储,数据量大插入和删除的效率就会低。
deque就是为了高效实现插入和删除操作的双向列表,适用于队列和栈。并且deque是线程安全的
-
导入
from collections import deque
-
使用
q = deque([1,2,3,4,5]) q.append(6) q.appendleft(0) print(q.pop()) print(q.popleft()) print(q)
-
-
defaultdict
-
概述
使用dict时,如果引用的key不存在,如果使用的[]方式则会报KeyError异常,如果使用的get()方式则会得到None。
如果希望key不存在时也能得到一个默认的值就使用defaultdict -
导入
from collections import defaultdict
-
使用
d1 = {"a": 1, "b": 2, "c": 3} # print(d1["d"]) # print(d1.get("d")) d2 = defaultdict(lambda :"键值对不存在") d2["a"] = 1 d2["b"] = 2 print(d2["c"]) print(d2.get("c")) print(d2, type(d2), isinstance(d2, dict))
-
-
OrderedDict
-
概述
使用dict是,key是无序的。对dict做迭代时无法保证key的顺序。如果需要key有顺序,就可以使用OrderDict
-
导入
from collections import OrderedDict
-
使用
d1 = {"a": 1, "b": 2, "c": 3} for key in d1: print(key) print("----------------------") d2 = OrderedDict([("a", 1),("b", 2),("c", 3)]) print(d2) print(d2["a"]) print(d2.get("b"))
-
-
Counter
-
概述
是一个简单的计数器,本质上是dict的一个子类
-
导入
from collections import Counter
-
使用
需求:计算集合中每个字符出现的次数
s = "zutuanxue_com is a good man" c = Counter() print(c, type(c), isinstance(c, dict)) for ch in s: c[ch] = c[ch] + 1 print(c) for key in c: print(key, c[key])
-
六、base64模块
-
概述
用记事本打开图片等文件,看到一坨乱码,因为二进制文件包含很多无法显示的内容。所以想让记事本能处理二进制数据,就需要将二进制字符串转换,base64是一种比较常见的二进制编码方式
-
作用
适用于小段内容的编码,比如数字证书签名、cookie、网页中传输的少量二进制数据
-
编码原理
一个包含64个字符的列表
[“A”, “B”, ……, “Z”, “a”, “b”, ……, “z”, “0”, “1”, ……, “9”, “+”, “/”]
对二进制数据进行处理,每是三个字节一组,一组就是3x8=24bit,划分为4组,每组正好6bit。得到4个数字作为索引,然后查表,获取相应的4个字符,就是编码后的字符串 -
注意
base64是一种通过查表的编码方法,不能用于加密,即使修改了字符对照表也不行
-
使用
-
b64encode
s1 = b"zutuanxue_com is a good man" print(base64.b64encode(s1)) s2 = b'c3VuY2sgaXMgYSBnb29kIG1hbg==' print(base64.b64decode(s2))
由于=字符也可能出现在base64编码中,但是=在url、cookie里会造成歧义,所以很多base64编码会把编码后的=去掉
s6 = b"abcd" s7 = base64.b64encode(s6) print(s7) ''' 'YWJjZA==' 'YWJjZA' ''' s8 = b'YWJjZA==' print(base64.b64decode(s8))
注意
由于标准base64编码后可能出现字符+或/,在URL中就不能直接作为参数
-
urlsafe_b64encode
提供urlsafe_b64encode编码,保证url的安全,将+和/替换为-和_,提供urlsafe_b64decode进行url安全解码
s3 = b"http://www.zutuanxue.com" print(base64.urlsafe_b64encode(s3)) s4 = b"aHR0cDovL3d3dy5zdW5jay53YW5n" print(base64.urlsafe_b64decode(s4)) s5 = b"zutuanxue_com is a good m~" print(base64.b64encode(s5)) print(base64.urlsafe_b64encode(s5))
-
七、hashlib模块
-
概述
该模块提供了常见的摘要算法,如MD5、SHA1
摘要算法(又称哈希算法、散列算法):它通过一个函数,把任意长度的数据转为一个长度固定的数据串(通常用16进制的字符串表示)
-
作用
用于加密
-
MD5
最常见的摘要算法,速度快,生成的结构是128位字节,通常用32位16进制字符串表示 -
使用
s1 = b"zutuanxue_com is a good man" m1 = hashlib.md5() m1.update(s1) ret = m1.hexdigest() print(ret) #如果数据量比加大,可以分多次调用update,最终结果是一样的 m2 = hashlib.md5() m2.update(b"zutuanxue_com is a") m2.update(b" good man") ret2 = m2.hexdigest() print(ret2)
-
SHA1
调用SHA1与调用MD5完全一样,SHA1的结果是160字节,通常用40位16进制字符串表示 -
使用
s2 = b"zutuanxue_com is a good man" sh1 = hashlib.sha1() sh1.update(s2) ret3 = sh1.hexdigest() print(ret3)
注意:数据量大同md5使用相同
-
更安全的
SHA256
SHA512
越安全的算法不见越慢,而且摘要越长 -
应用:
任何允许用户登录的网站都会存储用户登录的用户名和密码(存储在数据库中),那么密码一般存储的是原密码的摘要值
zutuanxue_com-666666明文存储到数据库中,如果数据库泄露,所有用户信息就会暴露正确的保存口令方式不是存储明文,而是存储口令的摘要,当用户登录时,首先计算用户输入的明文的摘要,和数据库中的对比,如果一致说明口令正确,否则一定错误
八、hmac模块
-
概述
实现了HMAC算法,是用一个key对数据进行“杂凑”后在进行的hash,是用hmac比hash算法更安全,不同的key会产生不同的hash值
-
导入
s = b"zutuanxue_com is a good man" key = b"good" h = hmac.new(key, s, digestmod="MD5") ret = h.hexdigest() print(ret)