xml 文件 压缩与解压

共3种
1.zip
2.gzip
3.bzip2
...

gzip 压缩器基于 DEFLATE 无损数据压缩算法,它使用 LZ77 算法和 Huffman 编码的组合。为了压缩数据,LZ77 算法使用对匹配数据的引用来取代数据部分。匹配数据已经通过编码器和解码器传递。Huffman 编码使用一种特定方法选择每个符号的表示,使用当时短位字符串的最常见的字符被使用,而不使用不常见的源符号。
bzip2 压缩器使用 Burrows-Wheeler 转换,将经常重复的字符序列转换成相同的字母字符串,然后应用 Move To Front 转换,最后使用 Huffman 编码。Burrows-Wheeler 变换排列字符的顺序可实现以下效果,如果原始字符串有经常出现的几个子字符串,那么变换后的字符串就会有几个地方出现一个字符,在一行中某个字符会重复出现多次。这种方法对于压缩非常有用,因为它往往容易压缩拥有多行重复字符的字符串。在实践中, bzip2 压缩方法压缩文件的比率比使用 gzip 进行压缩的比率高,但是性能也较低。
参考
http://snowolf.iteye.com/blog/643010和
http://blog.csdn.net/buyaore_wo/article/details/7047343(代码)
http://www.ibm.com/developerworks/cn/xml/x-datacompression/index.html(原理)

猜你喜欢

转载自lf6627926.iteye.com/blog/1405866