027_hashlib模块(摘要算法）

1，算法介绍

　　Python的hashlib提供了常见的摘要算法，如MD5，SHA1等等。
　　什么是摘要算法呢？摘要算法又称哈希算法、散列算法。它通过一个函数，把任意长度的数据转换为一个长度固定的数据串（通常用16进制的字符串表示）。
　　摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest，目的是为了发现原始数据是否被人篡改过。
　　摘要算法之所以能指出数据是否被篡改过，就是因为摘要函数是一个单向函数，计算f(data)很容易，但通过digest反推data却非常困难。而且，对原始数据做一个bit的修改，都会导致计算出的摘要完全不同。

　　1.1，我们以常见的摘要算法MD5为例，计算出一个字符串的MD5值：

import hashlib   # 提供摘要算法的模块
md5 = hashlib.md5()
md5.update('how to use md5 in python hashlib?')
print md5.hexdigest()

计算结果如下：
d26a53750bc40b38b65a520292f69306

　　1.2，如果数据量很大，可以分块多次调用update()，最后计算的结果是一样的：

md5 = hashlib.md5()
md5.update('how to use md5 in ')
md5.update('python hashlib?')
print md5.hexdigest()

　　1.3，MD5是最常见的摘要算法，速度很快，生成结果是固定的128 bit字节，通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1，调用SHA1和调用MD5完全类似：

import hashlib
 
sha1 = hashlib.sha1()
sha1.update('how to use sha1 in ')
sha1.update('python hashlib?')
print sha1.hexdigest()

　　SHA1的结果是160 bit字节，通常用一个40位的16进制字符串表示。比SHA1更安全的算法是SHA256和SHA512，不过越安全的算法越慢，而且摘要长度更长。

2，概括与使用

　　2.1，

不管算法多么不同，摘要的功能始终不变
对于相同的字符串使用同一个算法进行摘要，得到的值总是不变的
使用不同算法对相同的字符串进行摘要，得到的值应该不同
不管使用什么算法，hashlib的方式永远不变

　　2.2，摘要算法使用

密码的密文存储
文件的一致性验证
在下载的时候

　　　　　　# 检查我们下载的文件和远程服务器上的文件是否一致

　　　　　　# 两台机器上的两个文件你想检查这两个文件是否相等

3，注册

# 用户注册
# 用户输入用户名
# 用户输入密码
# 明文的密码进行摘要拿到一个密文的密码
# 写入文件

# 用户的登录

import hashlib
usr = input('username :')
pwd = input('password : ')
with open('userinfo') as f:
    for line in f:
        user,passwd,role = line.split('|')
        md5 = hashlib.md5()
        md5.update(bytes(pwd,encoding='utf-8'))
        md5_pwd = md5.hexdigest()
        if usr == user and md5_pwd == passwd:
            print('登录成功')

4，加盐

　　虽然不可以解密，但是过于简单的密码可以通过“撞库”得到原密码，即将一些可能的密码经过摘要后存入库中，在拿需要解密的密码的摘要对比，得到原密码。

　　为解决这一个问题，可以使用“加盐”的方式使摘要结果复杂。

　　4.1，加盐

import hashlib   # 提供摘要算法的模块
md5 = hashlib.md5(bytes('盐',encoding='utf-8'))
# md5 = hashlib.md5()  #原来的方式，不加盐的方式
md5.update(b'123456')
print(md5.hexdigest())

　　4.2，动态加盐

　　　　使用用户名的一部分或者直接使用整个用户名作为盐

import hashlib   # 提供摘要算法的模块
md5 = hashlib.md5(bytes('盐',encoding='utf-8')+b'')
# md5 = hashlib.md5()  #原来的方式，不加盐的方式
md5.update(b'123456')
print(md5.hexdigest())

5，文件的一致性校验
　　# 文件的一致性校验这里不需要加盐　

027_hashlib模块(摘要算法）

猜你喜欢