Hadoop相关命令 - 代码天地

Hadoop相关命令

其他 2018-09-12 02:18:50 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/gao158190523/article/details/60758194

1.默认情况

在Hadoop streaming的默认情况下，是以”\t”作为分隔符的。对于标准输入来说，每行的第一个”\t” 以前的部分为key，其他部分为对应的value。如果一个”\t”字符没有，则整行都被当做key。这个

2.map阶段的sort与partition

map阶段很重要的阶段包括sort与partition。排序是按照key来进行的。咱们之前讲了默认的key是由”\t”分隔得到的。我们能不能自己控制相关的sort与partition呢？答案是可以的。

先看以下几个参数：
map.output.key.field.separator： map中key内部的分隔符
num.key.fields.for.partition：分桶时，key按前面指定的分隔符分隔之后，用于分桶的key占的列数。通俗地讲，就是partition时候按照key中的前几列进行划分，相同的key会被打到同一个reduce里。
-partitioner org.apache.hadoop.mapred.lib.KeyFieldBasedPartitioner 前两个参数，要配合partitioner选项使用！

stream.map.output.field.separator： map中的key与value分隔符
stream.num.map.output.key.fields： map中分隔符的位置，该选项可以指定按照前几列来进行排序，通常配合num.key.fields.for.partition使用，用来对排好序后按照num.key.fields.for.partition指定的分桶值来分桶。
stream.reduce.output.field.separator： reduce中key与value的分隔符
stream.num.reduce.output.key.fields： reduce中分隔符的位置

猜你喜欢

转载自blog.csdn.net/gao158190523/article/details/60758194

hadoop命令---job相关

Hadoop相关命令

Hadoop启动相关命令

五:hadoop hdfs相关命令

Hadoop、Yarn相关命令简介

【Hadoop】管理集群相关命令

linux 中hadoop相关命令学习

Hadoop：查看任务管理相关——操作命令

Hadoop操作HDFS的相关命令（python）

Hadoop操作HDFS的相关命令（python）

Hadoop 相关

Hadoop相关

Hadoop命令 hadoop fs

【Hadoop】Hadoop Shell命令

hadoop 命令

hadoop命令

hadoop 的命令

[Hadoop]Hive r0.9.0中文文档（三）之Hive相关命令

【Hadoop学习笔记第一章】Day03 Linux相关命令介绍2

【Hadoop学习笔记第一章】Day02 Linux相关命令介绍1

hadoop相关知识总结

Hadoop MapReduce优化相关

hadoop 索引相关记录

hadoop相关备录

hadoop相关知识

hbase、hadoop checksum相关

hadoop 相关博客推荐

Hadoop：相关概念

Hadoop相关文章汇集

Hadoop 相关文档地址

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)