python生成短url

因为文本中显示太长的url会比较乱,或者采用省略显示的方式,或者采用短url的方式.
为了同时方便统计点击数以及进行内容过滤.实现了一个生成短url值的方法.
为了防止你的hash值被破解,可以在生成md5值的时候加入你自己的salt.
这样即便直到你的code_map也不能破解到原始url了.
为了让结果更加随机,把每次循环没有使用的第二个bit保存到e里面.这样可以让结果冲突率更小.

import hashlib

def get_md5(s):
    s = s.encode('utf8') if isinstance(s, unicode) else s
    m = hashlib.md5()
    m.update(s)
    return m.hexdigest()

code_map = (
           'a' , 'b' , 'c' , 'd' , 'e' , 'f' , 'g' , 'h' ,
           'i' , 'j' , 'k' , 'l' , 'm' , 'n' , 'o' , 'p' ,
           'q' , 'r' , 's' , 't' , 'u' , 'v' , 'w' , 'x' ,
           'y' , 'z' , '0' , '1' , '2' , '3' , '4' , '5' ,
           '6' , '7' , '8' , '9' , 'A' , 'B' , 'C' , 'D' ,
           'E' , 'F' , 'G' , 'H' , 'I' , 'J' , 'K' , 'L' ,
           'M' , 'N' , 'O' , 'P' , 'Q' , 'R' , 'S' , 'T' ,
           'U' , 'V' , 'W' , 'X' , 'Y' , 'Z'
            )


def get_hash_key(long_url):
    hkeys = []
    hex = get_md5(long_url)
    for i in xrange(0, 4):
        n = int(hex[i*8:(i+1)*8], 16)
        v = []
        e = 0
        for j in xrange(0, 5):
            x = 0x0000003D & n
            e |= ((0x00000002 & n ) >> 1) << j
            v.insert(0, code_map[x])
            n = n >> 6
        e |= n << 5
        v.insert(0, code_map[e & 0x0000003D])
        hkeys.append(''.join(v))
    return hkeys

if __name__ == '__main__':
    print get_hash_key('http://www.google.com/123')

猜你喜欢

转载自yancl.iteye.com/blog/1771160