Base64编码原理分析

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/realDonaldTrump/article/details/89531614

Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ASCII码的控制字符就不能通过邮件传送。这样就受到了很大的限制,比如图片二进制流的每个字节不可能全部是可见字符,所以就传送不了。最好的方法就是在不改变传统协议的情况下,开辟一种新的方案来支持二进制文件的传送。把不可见字符用可见字符来表示。而Base64就是一种基于64个可见字符来表示二进制数据的表示方法。

Base64编码的作用

用64个可见字符来表示数据,通过这种组合方式来表示数据。

原理

Base64可以将ASCII字符串或者是二进制编码成只包含A—Z,a—z,0—9,+,/ 这64个字符( 26个大写字母,26个小写字母,10个数字,1个+,一个 / 刚好64个字符)。这64个字符用6个bit位就可以全部表示出来,一个字节有8个bit 位,那么还剩下两个bit位,这两个bit位用0来补充。其实,一个Base64字符仍然是8个bit位,但是有效部分只有右边的6个 bit,左边两个永远是0。

Base64的编码规则是将3个8位字节(3×8=24位)编码成4个6位的字节(4×6=24位),之后在每个6位字节前面,补充两个0,形成4个8位字节的形式,那么取值范围就变成了0~63。又因为2的6次方等于64,所以每6个位组成一个单元。

将源文件以标准字节(byte)为单位转化成二进制,一个字节占8个位(bit),如“ABC”的二进制是01000001、01000010、01000011,这样源文件就形成了每8个bit一组的一串二进制,然后将这些二进制串以base64特有的规则(每个字节占6个位)再转化成base64格式的字符(如下图),编码完成。

Base64将3个字节转变为4个字节,因此,编码后的代码量(以字节为单位)约比编码前的代码量多了1/3。如果代码量正好是3的整数倍,那么恰好多了1/3。但如果不是,那么,当多出的代码量不是3的整数倍时,代码量除以3的余数就是2或者1。转换的时候,结果不够6位的用0来补上相应的位置,之后再在6位的前面补两个0。转换完空出的结果就用就用“=”来补位,总之要保证最后编码出来得字节数是4的倍数。

举例

在这里插入图片描述

Base64实际上并没有加密,它只是将字符串重新进行编码,编码后让人一眼看上去与编码前完全不同。只是一种编码方式,并不是加密方式。

任何Base64编码都能被轻松decode,但是注意,必须知道你拿到的字符串经过了几次base64编码,过程中有没有经过其它编码加工或加密。如,一个字符串可能连续进行了两次base64编码,此时要进行两次base64decode才是原数据。

如何让Base64具有加密、混淆功能

  • 可以混合使用,如进行多次Base64编码,或者增加其它加密方式
  • 可以在数据的头或尾增加数据后再base64编码以混淆;或者在base64编码后再头尾增加数据后混淆
  • 可以规定数据从头到尾还是从尾到头进行base64编码和解码
  • ==打乱Base64编码规则:==Server和Client约定好自定义的Base64编解码规则,使用自己的协议来进行数据解析和编码。

类似的例子:Base32(5bit)、Base16(4bit)

加密的含义

加密的一个重要属性是加密的结果必须能够被解密:故哈希hash(md5、sha1)都不是加密,只是哈希计算

base64只是一种encode,但是由于它确实不能直接看到明文,也能够从结果解码得到原数据,因此它可以算是加密,但应该属于明文加密,可被解码

真正的加密,应该是rsa、aes等等

猜你喜欢

转载自blog.csdn.net/realDonaldTrump/article/details/89531614