大数据技术-MR支持的压缩编码 - 代码天地

大数据技术-MR支持的压缩编码

其他 2020-10-26 09:41:17 阅读次数: 0

MR支持的压缩编码

表4-7

压缩格式	hadoop自带？	算法	文件扩展名	是否可切分	换成压缩格式后，原来的程序是否需要修改
DEFLATE	是，直接使用	DEFLATE	.deflate	否	和文本处理一样，不需要修改
Gzip	是，直接使用	DEFLATE	.gz	否	和文本处理一样，不需要修改
bzip2	是，直接使用	bzip2	.bz2	是	和文本处理一样，不需要修改
LZO	否，需要安装	LZO	.lzo	是	需要建索引，还需要指定输入格式
Snappy	否，需要安装	Snappy	.snappy	否	和文本处理一样，不需要修改

为了支持多种压缩/解压缩算法，Hadoop引入了编码/解码器，如下表所示。

表4-8

压缩格式	对应的编码/解码器
DEFLATE	org.apache.hadoop.io.compress.DefaultCodec
gzip	org.apache.hadoop.io.compress.GzipCodec
bzip2	org.apache.hadoop.io.compress.BZip2Codec
LZO	com.hadoop.compression.lzo.LzopCodec
Snappy	org.apache.hadoop.io.compress.SnappyCodec

压缩性能的比较

表4-9

压缩算法	原始文件大小	压缩文件大小	压缩速度	解压速度
gzip	8.3GB	1.8GB	17.5MB/s	58MB/s
bzip2	8.3GB	1.1GB	2.4MB/s	9.5MB/s
LZO	8.3GB	2.9GB	49.3MB/s	74.6MB/s

http://google.github.io/snappy/

On a single core of a Core i7 processor in 64-bit mode, Snappy compresses at about 250 MB/sec or more and decompresses at about 500 MB/sec or more.

大数据培训

猜你喜欢

转载自blog.csdn.net/msjhw_com/article/details/109175120

大数据技术-MR支持的压缩编码

hadoop支持的压缩编码

大数据与算法系列之字符压缩编码

HBase数据压缩编码探索

音频压缩编码技术（三）—常用编码器

压缩编码

单词的压缩编码

字符压缩编码

CCF 压缩编码

MPEG-2压缩编码技术原理应用

数字图像处理技术之图像压缩编码

MPEG4视频压缩编码技术详解

【图像处理】图像&视频压缩编码技术综述

音频压缩编码技术（五）—音频重采样

【FFmpeg实战】H264压缩编码技术

高效的数据压缩编码方式 Protobuf

霍夫曼压缩编码算法

leetcode单词的压缩编码

压缩编码区间dp

赫夫曼编码Huffman,霍夫曼编码，哈夫曼数据压缩编码，参考源代码，C语言，数据结构，无损压缩编码，VS编译，通讯压缩，无失真压缩编码，实用，案例，样例，标准参考，值得参考借鉴，高效压缩编码通讯压缩

音频压缩编码技术（五）—ffmpeg命令方式生成AAC文件

音频压缩编码技术（四）—AAC编解码器

JPEG压缩编码算法原理

CCF 压缩编码动态规划

CSP之压缩编码（动态规划）

ccf 201612-4 压缩编码

视频压缩编码标准

视频压缩编码问答－－转载

820. 单词的压缩编码

Leetcode.820.单词的压缩编码

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)