大数据框架——pig学习权威指南

其他 2018-06-09 05:08:32 阅读次数: 2

应用场景

Pig并不适合所有的数据处理任务，和MapReduce一样，它是为数据批处理而设计的，如果想执行的查询只涉及一个大型数据集的一小部分数据，Pig的实现不会很好，因为它要扫描整个数据集或其中很大一部分。
随着新版本发布，Pig的表现和原生MapRedece程序差距越来越小，因为Pig的开发团队使用了复杂、精巧的算法来实现Pig的关系操作。除非你愿意花大量时间来优化Java MapReduce程序，否则使用Pig Latin来编写查询的确能帮你节约时间。

操作步骤

1 Pig介绍

Pig是yahoo捐献给apache的一个项目，使用SQL-like语言，是在MapReduce上构建的一种高级查询语言，把一些运算编译进MapReduce模型的Map和Reduce中。Pig 有两种运行模式：Local 模式和 MapReduce 模式。

本地模式：Pig运行于本地模式，只涉及到单独的一台计算机
MapReduce模式：Pig运行于MapReduce模式，需要能访问一个Hadoop集群，并且需要装上HDFS

Pig的调用方式：

Grunt shell方式：通过交互的方式，输入命令执行任务；
Pig script方式：通过script脚本的方式来运行任务；
嵌入式方式：嵌入java源代码中，通过java调用来运行任务。

2 Pig使用

把/etc/passwd文件中的第一列取出来。

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

Pig的知识相对来说比较少，安装容易，使用方便，需要多学的就是pig latin这个脚本语言的熟练，更多的各种语法，会查会用即可。Pig一般很少用，项目中用不到。

猜你喜欢

转载自blog.csdn.net/qq_35036995/article/details/80473519

大数据框架——pig学习权威指南

大数据协作框架——sqoop学习权威指南

大数据数据仓库——hive学习权威指南

《Hadoop 权威指南 - 大数据的存储与分析》学习笔记

2019大数据学习框架及指南

大数据存储框架之Elastaticsearch权威指南阅读(1) 基础篇(1) 集群内原理

大数据--Apache Pig

大数据Pig汇总

大数据之PIG

《MongoDB大数据处理权威指南》读书笔记

大数据处理Pig

Hadoop权威指南-大数据的存储与分析第四版——学习笔记——第2章——1

Git权威指南-学习

es权威指南学习

学习hive权威指南

《Hadoop权威指南》---相关框架

大数据学习指南

学习Hadoop权威指南之MapReducer气象数据分析

学习笔记:从0开始学习大数据-31. pig安装运行

大数据平台运维之Pig

大数据Hadoop生态圈：Pig

elasticsearch权威指南学习3

《HTTP权威指南》学习总结

权威指南vuejs 学习笔记

es权威指南学习（二）

Elasticsearch权威指南学习笔记

《JavaScript权威指南》学习笔记

kafka权威指南学习笔记

javascript权威指南--学习笔记

学习【JavaScript权威指南】（一）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)