Python 常用模块-组团学

一、time模块

名词
UTC（世界协调时间）：格林尼治时间，世界标准时间，在中国为UTC+8

DST（夏令时）：是一种为了节约能源而人为规定地方时间的制度，一般在天亮早的夏季将时间提前一小时

时间的表示形式

时间戳
以整型或浮点型表示的是一个以秒为单位的时间间隔，这个时间的基础值是1970年1月1号零时开始算
元组
一种python的数据结构表示方式，这个元组有9个整数元素，分别表示不同的时间含义
year 年
month(1-12) 月
day(1-31) 日
hours(0-23) 时
minutes(0-59) 分
seconds(0-59) 秒
weekday(0-6，0表示星期一) 周
Julian day(1-366)：表示当前日期在本年度是第几天
DST flag(-1 or 0 or 1)：夏令时格式，0表示正常格式，1表示夏令时格式，-1表示根据当前的时间格式来判定

格式化字符串

格式化字符	含义
%a	本地简化星期名称
%A	本地完整星期名称
%b	本地简化月份名称
%B	本地完整月份名称
%c	本地相应的日期和时间表示
%d	一个月中的第几天(01-31)
%H	一天中的第几个小时(24时制,00-23)
%I	一天中的第几个小时(12时制,01-12
%j	一年中的第几天(001-366)
%m	月份（01-12）
%M	分钟数（00-59）
%p	本地am或者pm的响应符号
%S	秒（00-59）
%U	一年中的星期数，以星期日为一个星期
%w	一个星期中的第几天（0-6,0表示星期日）
%W	和%U基本相同，以星期一为一个星期
%x	本地相应的日期
%X	本地相应的时间
%y	去掉世纪的年份(00-99)
%Y	完整的年份
%Z	时区的名字，如果不存在为空字符串

导入
```
import time
```
方法
- time()
  
  返回当前时间的时间戳，无需参数，返回值为浮点型
```
t1 = time.time()
print(t1)
```
- gmtime([t])
  
  将给定的时间戳转为UTC时间元组，如果没有参数默认转换当前时间戳
```
t2 = time.gmtime()
print(t2)
```
- localtime([t])
  
  将给定的时间戳转为本地时间元组格式，如果没有参数默认转换当前时间戳
```
t3 = time.localtime()
print(t3)
```
- mktime(tt)
  
  将本地时间元组转为时间戳
```
t4 = time.mktime(t3)
print(t4)
```
- asctime([tt])
  
  将时间元组格式转为指定格式的字符串形式，如果没有参数默认使用localtime时间的时间元组
```
t5 = time.asctime(t3)
print(t5, type(t5))
```
- ctime([tt])
  
  将时间戳格式转为指定格式的字符串形式，如果没有参数默认使用当前时间戳
```
t6 = time.ctime()
print(t6)
```
- strftime(format[, tt])
  
  将时间元组以指定的格式转为字符串，如果没有tt参数默认使用当前本地时间元组
```
t7 = time.strftime("%Y-%m-%d %H:%M:%S", t3)
print(t7)
```
- strptime(st, format)
  
  将指定格式的字符串解析为时间元组，是strftime的逆过程
  
  注意：format表示的格式要与st一致
```
t8 = time.strptime("2001-10-01 08:08:08", "%Y-%m-%d %H:%M:%S")
print(t8)
```
- sleep()
  
  延迟一个时间段，接收整型或者浮点型
```
time.sleep(2)
```
- clock()
  
  返回当前程序执行时间，Unix系统始终返回全部运行时间，而Windows系统从第二次开始都是以第一次调用此函数的时间戳为基准，而不是以程序开始的时间为基准
```
#                   windows   Unix
print(time.clock()) # 0         1
time.sleep(1)
print(time.clock()) # 1         2
time.sleep(1)
print(time.clock()) # 2         3
```

二、datetime模块

概述

datetime比time高级，可以理解为datetime基于time进行了封装，提供了更简单的函数接口，datetime模块的接口更直观、更容易调用

模块中的类
- time 只关注时间
- date 只关注日期
- datetime 同时关注日期和时间
- timedelta 主要用于计算时间跨度
- tzinfo 时区相关
导入
```
import datetime
```

方法

获取当前时间

t1 = datetime.datetime.now()
print(t1, type(t1))

获取指定日期时间

t2 = datetime.datetime(2001, 10, 1, 8, 8, 8)
print(t2)

将datetime时间转对象为字符串

t3 = t1.strftime("%X %x")
print(t3, type(t3))

将字符串转为datetime对象

t4 = datetime.datetime.strptime(t3, "%X %x")
print(t4, type(t4))

时间相减，返回一个时间间隔

t5 = datetime.datetime(2001, 10, 1, 8, 8, 8)
t6 = datetime.datetime(2001, 10, 2, 9, 8, 9)
t7 = t6- t5
print(t7, type(t7))
#获取时间间隔天数
print(t7.days)
#获取去除间隔天数以外的间隔秒数
print(t7.seconds)

三、calendar模块

概述

日历模块
导入
```
import calendar
```
方法
- 返回指定年的某月
```
print(calendar.month(2019, 2))
```
- 返回指定年的日历
```
print(calendar.calendar(2018))
```
- 判断是否是闰年
```
print(calendar.isleap(2000))
```
- 返回某个月的weekday的第一天和这个月的所有天数
```
print(calendar.monthrange(2019, 4))
```
- 返回某一个月以一周为周期的元素序列
```
print(calendar.monthcalendar(2019, 2))
```

四、uuid模块

概述

是128位的全局唯一标识符，通常由32字节的字母串表示，它可以保证时间和空间的唯一性，也称为GUID
作用

随机生成字符串，在token、账号、订单号等需要唯一标识的地方使用
原理

通过Mac地址、时间戳、命名空间、随机数、伪随机数来保证产生的id的唯一性
算法：
- uuid1()基于时间戳
  有MAC地址、当前时间戳、随机数字，可以保证全球范围内的唯一性。但是由于MAC地址的使用会带来安全问题，局域网中可以使用IP来代替MAC
- uuid2()基于分布式计算环境DCE
  算法和uuid1()相同，不同的是把时间戳的前4位换成POSI的UID，实际当中很少使用
  
  注意：python中没有这个函数
- uuid3()基于名字和MD5散列值
  通过计算名和命名空间的MD5散列值得到，保证了同一命名空间中不同名字的唯一性，和不同命名空间的唯一性，但是同一命名空间的相同名字生成相同的uuid
- uuid4()基于随机数
  由伪随机数得到的，有一定的重复概率，这个重复概率是可以通过计算得到的
- uuid5()基于名字和SHA1散列值
  算法和uuid3()相同，不同的是使用SHA1算法
使用经验：
- python中没有基于DCE的，所以uuid2()可以忽略
- uuid4()存储概率性重复，由于无映射性所以最好不用
- 如果在全局的分布式环境下，最好使用uuid1()
- 若名字的唯一性要求，最好使用uuid3()或者uuid5()
导入
```
import uuid
```

使用

a = uuid.uuid1()
print(a, type(a))
b = str(a)
print(b, type(b))
# print(uuid.uuid2())
print(uuid.uuid3(uuid.NAMESPACE_DNS, "zutuanxue_com"))
print(uuid.uuid3(uuid.NAMESPACE_DNS, "zutuanxue_com"))
print(uuid.uuid3(uuid.NAMESPACE_OID, "zutuanxue_com"))
print(uuid.uuid3(uuid.NAMESPACE_DNS, "zutuanxue_com"))
print(uuid.uuid5(uuid.NAMESPACE_DNS, "zutuanxue_com"))

五、collections模块

概述

python中内建的一个集合模块，提供了许多有用的集合类

namedtuple

概述

命名元组，本质是一个函数，用他来创建一个自定义的tuple类型

规定tuple元素的格式，并可以用属性而不是索引引用tuple中的元素

用namedtuple实际上是创建一个新的数据类型
导入
```
from collections import namedtuple
```

使用

#假设这是一个点的坐标，但是没有写注释，时间久了就忘了该有含义
p = (1, 2)


# 定义一个新的数据类型，
Point = namedtuple("point", ["x", "y"])
# 定义一个Point类型的变量，保存一个元组数据
p2 = Point(1, 2)
print(p2, isinstance(p2, Point), isinstance(p2, tuple))
#访问命名元组元素的值
print(p2[0], p2[1])
print(p2.x, p2.y)

deque
- 概述
  
  使用list存储数据，按索引访问元素，但是插入和删除元素会根据元素的个数增多个降低效率。因为list是线性存储，数据量大插入和删除的效率就会低。
  
  deque就是为了高效实现插入和删除操作的双向列表，适用于队列和栈。并且deque是线程安全的
- 导入
```
from collections import deque
```
- 使用
```
q = deque([1,2,3,4,5])

q.append(6)
q.appendleft(0)

print(q.pop())
print(q.popleft())

print(q)
```

defaultdict

概述

使用dict时，如果引用的key不存在，如果使用的[]方式则会报KeyError异常，如果使用的get()方式则会得到None。
如果希望key不存在时也能得到一个默认的值就使用defaultdict
导入
```
from collections import defaultdict
```

使用

d1 = {"a": 1, "b": 2, "c": 3}
# print(d1["d"])
# print(d1.get("d"))


d2 = defaultdict(lambda :"键值对不存在")
d2["a"] = 1
d2["b"] = 2
print(d2["c"])
print(d2.get("c"))
print(d2, type(d2), isinstance(d2, dict))

OrderedDict

概述

使用dict是，key是无序的。对dict做迭代时无法保证key的顺序。如果需要key有顺序，就可以使用OrderDict
导入
```
from collections import OrderedDict
```

使用

d1 = {"a": 1, "b": 2, "c": 3}
for key in d1:
    print(key)
print("----------------------")



d2 = OrderedDict([("a", 1),("b", 2),("c", 3)])
print(d2)
print(d2["a"])
print(d2.get("b"))

Counter

概述

是一个简单的计数器，本质上是dict的一个子类
导入
```
from collections import Counter
```

使用

需求：计算集合中每个字符出现的次数

s = "zutuanxue_com is a good man"
c = Counter()
print(c, type(c), isinstance(c, dict))
for ch in s:
    c[ch] = c[ch] + 1
print(c)
for key in c:
    print(key, c[key])

六、base64模块

概述

用记事本打开图片等文件，看到一坨乱码，因为二进制文件包含很多无法显示的内容。所以想让记事本能处理二进制数据，就需要将二进制字符串转换，base64是一种比较常见的二进制编码方式
作用

适用于小段内容的编码，比如数字证书签名、cookie、网页中传输的少量二进制数据
编码原理

一个包含64个字符的列表
[“A”, “B”, ……, “Z”, “a”, “b”, ……, “z”, “0”, “1”, ……, “9”, “+”, “/”]
对二进制数据进行处理，每是三个字节一组，一组就是3x8=24bit，划分为4组，每组正好6bit。得到4个数字作为索引，然后查表，获取相应的4个字符，就是编码后的字符串
注意

base64是一种通过查表的编码方法，不能用于加密，即使修改了字符对照表也不行

使用

b64encode

s1 = b"zutuanxue_com is a good man"
print(base64.b64encode(s1))
s2 = b'c3VuY2sgaXMgYSBnb29kIG1hbg=='
print(base64.b64decode(s2))

由于=字符也可能出现在base64编码中，但是=在url、cookie里会造成歧义，所以很多base64编码会把编码后的=去掉

s6 = b"abcd"
s7 = base64.b64encode(s6)
print(s7)
'''
'YWJjZA=='
'YWJjZA'
'''
s8 = b'YWJjZA=='
print(base64.b64decode(s8))

注意

由于标准base64编码后可能出现字符+或/，在URL中就不能直接作为参数

urlsafe_b64encode

提供urlsafe_b64encode编码，保证url的安全，将+和/替换为-和_，提供urlsafe_b64decode进行url安全解码

s3 = b"http://www.zutuanxue.com"
print(base64.urlsafe_b64encode(s3))
s4 = b"aHR0cDovL3d3dy5zdW5jay53YW5n"
print(base64.urlsafe_b64decode(s4))

s5 = b"zutuanxue_com is a good m~"
print(base64.b64encode(s5))
print(base64.urlsafe_b64encode(s5))

七、hashlib模块

概述

该模块提供了常见的摘要算法，如MD5、SHA1

摘要算法(又称哈希算法、散列算法)：它通过一个函数，把任意长度的数据转为一个长度固定的数据串(通常用16进制的字符串表示)
作用

用于加密
MD5
最常见的摘要算法，速度快，生成的结构是128位字节，通常用32位16进制字符串表示

使用

s1 = b"zutuanxue_com is a good man"
m1 = hashlib.md5()
m1.update(s1)
ret = m1.hexdigest()
print(ret)

#如果数据量比加大，可以分多次调用update，最终结果是一样的
m2 = hashlib.md5()
m2.update(b"zutuanxue_com is a")
m2.update(b" good man")
ret2 = m2.hexdigest()
print(ret2)

SHA1
调用SHA1与调用MD5完全一样，SHA1的结果是160字节，通常用40位16进制字符串表示

使用

s2 = b"zutuanxue_com is a good man"
sh1 = hashlib.sha1()
sh1.update(s2)
ret3 = sh1.hexdigest()
print(ret3)

注意：数据量大同md5使用相同

更安全的
SHA256
SHA512
越安全的算法不见越慢，而且摘要越长
应用：
任何允许用户登录的网站都会存储用户登录的用户名和密码(存储在数据库中)，那么密码一般存储的是原密码的摘要值
zutuanxue_com-666666明文存储到数据库中，如果数据库泄露，所有用户信息就会暴露

正确的保存口令方式不是存储明文，而是存储口令的摘要，当用户登录时，首先计算用户输入的明文的摘要，和数据库中的对比，如果一致说明口令正确，否则一定错误

八、hmac模块

概述

实现了HMAC算法，是用一个key对数据进行“杂凑”后在进行的hash，是用hmac比hash算法更安全，不同的key会产生不同的hash值

导入

s = b"zutuanxue_com is a good man"
key = b"good"
h = hmac.new(key, s, digestmod="MD5")
ret = h.hexdigest()
print(ret)