一、hashilib
算法介绍:
Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。
什么是摘要算法呢?
摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。
最常用的两种算法:MD5,SHA1
1)MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似;
2)SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法越慢,而且摘要长度更长。
摘要算法的应用:
1)加密认证
如果以明文保存用户口令,如果数据库泄露,所有用户的口令就落入黑客的手里。此外,网站运维人员是可以访问数据库的,也就是能获取到所有用户的口令。正确的保存口令的方式是不存储用户的明文口令,而是存储用户口令的摘要,考虑这么个情况,很多用户喜欢用123456,888888,password这些简单的口令,于是,黑客可以事先计算出这些常用口令的MD5值,只需要对比数据库的MD5,黑客就获得了使用常用口令的用户账号。
由于常用口令的MD5值很容易被计算出来,所以,要确保存储的用户口令不是那些已经被计算出来的常用口令的MD5,这一方法通过对原始口令加一个复杂字符串来实现,俗称“加盐”。
2)校验文件一致性
摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。
摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。
【备注】摘要算法在很多地方都有广泛的应用。要注意摘要算法不是加密算法,不能用于加密(因为无法通过摘要反推明文),只能用于防篡改,但是它的单向计算特性决定了可以在不存储明文口令的情况下验证用户口令。
#md5 import hashlib md5obj = hashlib.md5() # 实例化一个md5摘要算法的对象 md5obj.update('alex3714'.encode('utf-8')) # 使用md5算法的对象来操作字符串,必须是bytes类型,可以使用encode进行转换 ret = md5obj.hexdigest() # 获取算法的结果 hex+digest 16进制+消化 print(ret, type(ret), len(ret)) # >>>aee949757a2e698417463d47acac93df <class 'str'> 32 # 注册 :alex3714 -摘要算法-> 文件里 # 登录 :alex3714 -摘要算法-> 和文件里比对 #sha算法 sha后面的数字越大,得到的结果就越长,摘要就越安全,需要的时间也越长 import hashlib md5obj = hashlib.sha1() # 实例化一个md5摘要算法的对象 md5obj.update('alex3714'.encode('utf-8')) # 使用md5算法的对象来操作字符串 ret = md5obj.hexdigest() # 获取算法的结果 hex+digest hexdigest(16进制+消化) print(ret, type(ret), len(ret)) # >>>8a003668a9c990f15148f9e4046e1410781533b6 <class 'str'> 40 # 撞库 # 别人有一个庞大的库 :存储了 字符串 --> md5值的关系 # 加盐 import hashlib md5obj = hashlib.md5('tesla'.encode('utf-8')) # 实例化一个md5摘要算法的对象,加盐 md5obj.update('alex3714'.encode('utf-8')) # 使用md5算法的对象来操作字符串 ret = md5obj.hexdigest() # 获取算法的结果 print(ret) # 加盐的执行结果:7dafaec086d0ddae18b63e4fffafbf8e # 不加盐的执行结果:#aee949757a2e698417463d47acac93df # 动态加盐 # userinfo表 username = 'alex' md5obj = hashlib.md5(username.encode('utf-8')) # 实例化一个md5摘要算法的对象,动态加盐(username) md5obj.update('alex3714'.encode('utf-8')) # 使用md5算法的对象来操作字符串 ret = md5obj.hexdigest() # 获取算法的结果 hex+digest 16进制+消化 print(ret) # 动态加盐的执行结果:aee949757a2e698417463d47acac93df # 不加盐的执行结果:#aee949757a2e698417463d47acac93df # 校验文件一致性 ,如果文件较大时,可以分段进行摘要运算 # 自动化 —— python代码来做验证 import hashlib md5obj = hashlib.md5() # 实例化一个md5摘要算法的对象 md5obj.update('alex'.encode('utf-8')) # 对字符串分多次进行摘要,最后的结果与一次对字符串进行摘要的结果一致 md5obj.update('3714'.encode('utf-8')) # 使用md5算法的对象来操作字符串 print(md5obj.hexdigest()) # alex3714进行一次摘要的结果:aee949757a2e698417463d47acac93df # 对alex3714进行分段摘要的结果:aee949757a2e698417463d47acac93df
【作业】写一个函数 接收两个文件的地址 返回T/F?