027_hashlib模块(摘要算法)

1,算法介绍

  Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。
  什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。
  摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。
  摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。

  1.1,我们以常见的摘要算法MD5为例,计算出一个字符串的MD5值:

import hashlib   # 提供摘要算法的模块
md5 = hashlib.md5()
md5.update('how to use md5 in python hashlib?')
print md5.hexdigest()

计算结果如下:
d26a53750bc40b38b65a520292f69306

  1.2,如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:

md5 = hashlib.md5()
md5.update('how to use md5 in ')
md5.update('python hashlib?')
print md5.hexdigest()

  1.3,MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:

import hashlib
 
sha1 = hashlib.sha1()
sha1.update('how to use sha1 in ')
sha1.update('python hashlib?')
print sha1.hexdigest()

  SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法越慢,而且摘要长度更长。

2,概括与使用

  2.1,

  • 不管算法多么不同,摘要的功能始终不变
  • 对于相同的字符串使用同一个算法进行摘要,得到的值总是不变的
  • 使用不同算法对相同的字符串进行摘要,得到的值应该不同
  • 不管使用什么算法,hashlib的方式永远不变

  2.2,摘要算法使用

  • 密码的密文存储
  • 文件的一致性验证
  • 在下载的时候

      # 检查我们下载的文件和远程服务器上的文件是否一致

      # 两台机器上的两个文件 你想检查这两个文件是否相等

3, 注册

# 用户注册
# 用户 输入用户名
# 用户输入 密码
# 明文的密码进行摘要 拿到一个密文的密码
# 写入文件

# 用户的登录

import hashlib
usr = input('username :')
pwd = input('password : ')
with open('userinfo') as f:
    for line in f:
        user,passwd,role = line.split('|')
        md5 = hashlib.md5()
        md5.update(bytes(pwd,encoding='utf-8'))
        md5_pwd = md5.hexdigest()
        if usr == user and md5_pwd == passwd:
            print('登录成功')

4,加盐

  虽然不可以解密,但是过于简单的密码可以通过“撞库”得到原密码,即将一些可能的密码经过摘要后存入库中,在拿需要解密的密码的摘要对比,得到原密码。

  为解决这一个问题,可以使用“加盐”的方式使摘要结果复杂。

  4.1, 加盐

import hashlib   # 提供摘要算法的模块
md5 = hashlib.md5(bytes('盐',encoding='utf-8'))
# md5 = hashlib.md5()  #原来的方式,不加盐的方式
md5.update(b'123456')
print(md5.hexdigest())

  4.2,动态加盐

    使用用户名的一部分或者 直接使用整个用户名作为盐

import hashlib   # 提供摘要算法的模块
md5 = hashlib.md5(bytes('盐',encoding='utf-8')+b'')
# md5 = hashlib.md5()  #原来的方式,不加盐的方式
md5.update(b'123456')
print(md5.hexdigest())

5,文件的一致性校验
  # 文件的一致性校验这里不需要加盐 

猜你喜欢

转载自www.cnblogs.com/eternity-twinkle/p/10644846.html