Hadoop 2.2.0下Pig安装及Pig的基础使用 - 代码天地

Hadoop 2.2.0下Pig安装及Pig的基础使用

其他 2018-12-09 20:51:04 阅读次数: 0

准备工作：

1、正常运行的Hadoop2.2.0环境；

2、自行编译好适用于Hadoop2.2.0环境的的Pig 0.12.0版本。

1)NameNode的机器上安装apache-ant，将ant的可执行文件路径放入环境变量PATH中;

2)确定NameNode能够连接网络，我使用的是虚拟机桥接的方式，可以连接互联网；

3)下载Pig 0.12.0的src文件，tar包解压后，在解压的目录下执行命令：

ant clean jar-withouthadoop -Dhadoopversion=23

3、准备数据，拷贝到Hdfs中，数据格式如下：

  James,Network,Tom,98
  James,Computer,Jim,86
  Lily,Network,Tom,86
Lily,Philosophy,Lilei,77
Lucy,Korean,Piao,98
Lucy,Network,Tom,98
James,Database,Tom,88

编译完成后：

1、设置环境变量，修改.bash_profile文件，而后source .bash_profile

PATH=/opt/pig-0.12.0-src/bin:$JAVA_HOME/bin:$PATH
export PATH
PIG_CLASSPATH=/opt/hadoop-2.2.0/etc/hadoop
export PIG_CLASSPATH

2、Shell下运行pig命令，默认进入mapreduce模式，执行如下命令：

A = LOAD 'chengji.txt' USING PigStorage(',') AS (student,course,teacher,score:int);

DUMP A;

遗留问题：

PIG中能运行出结果，但是在运行过程中报错：

Call From cloud001/192.168.1.105 to cloud001:10020 failed on connection exception:

cloud001是我的namenode，net -an | grep 10020查看这个端口确实没打开

在mapred-site.xml文件中配置：

<property>
        <name>mapreduce.jobhistory.address</name>
        <value>hdfs://cloud001:10020</value>
</property>
<property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>hdfs://cloud001:19888</value>
</property>

目前还是不知道原因，暂作记录，后续如果知道原理再排查。

猜你喜欢

转载自blog.csdn.net/wendll/article/details/21776717

Hadoop 2.2.0下Pig安装及Pig的基础使用

hadoop pig 安装

Hadoop集群安装Pig

学习Hadoop——Pig 安装和介绍

hadoop pig入门总结

hadoop pig vertica

[Hadoop]Pig与Hive的区别

Hadoop家族安装系列(4)——pig0.12安装

pig 部署在hadoop 23上

[Hadoop]转载-Pig的简单介绍

【原创】Hadoop pig进阶语法

Pig 0.12安装配置（HADOOP2.2）

CDH-Hadoop2.6+ Apache Pig0.15安装记录

hadoop入门--使用Apache Pig统计每个航班班次

使用CDH的hadoop里面有对应的组件Pig

Hadoop生态圈之Pig

Hadoop的学习笔记（Hive|pig|zookeeper|hbase）

大数据Hadoop生态圈：Pig

Hadoop之家族成员Pig简介

hadoop 2.2.0安装

安装hadoop2.2.0

pig中hadoop参数设置（详解pig.maxCombinedSplitSize 和 pig.splitCombination）

PIG安装使用

Pig的安装及基本使用

使用CDH的hadoop里面有对应的组件Pig，但版本较低

hadoop 2.2.0 伪分布安装

hadoop-2.2.0单点安装

基于hadoop平台的pig语言对apache日志系统的分析

[转]Yahoo持续的Pig/Hadoop(MapReduce)工作流

hadoop 生态圈（pig，hive，hbase，ZooKeeper，Sqoop）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)