Apache Spark 初体验

其他 2020-04-04 09:22:03 阅读次数: 0

启动spark-shell

直接启动bin目录下的spark-shell:

./spark-shell

spark-shell说明

直接使用./spark-shell

表示使用local 模式启动，在本机启动一个SparkSubmit进程

还可指定参数 --master，如：

spark-shell --master local[N] 表示在本地模拟N个线程来运行当前任务
spark-shell --master local[*] 表示使用当前机器上所有可用的资源

不携带参数默认就是

spark-shell --master local[*]

后续还可以使用–master指定集群地址，表示把任务提交到集群上运行，如

./spark-shell --master spark://hadoop01:7077

退出spark-shell

使用 :quit

读取本地文件

准备数据

vim /root/words.txt

hello me you her 
hello you her
hello her 
hello

val textFile = sc.textFile("file:///root/words.txt")
val counts = textFile.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _)
counts.collect//收集结果
// Array[(String, Int)] = Array((you,2), (hello,4), (me,1), (her,3))

读取HDFS文件

准备数据

上传文件到hdfs

hadoop fs -put /root/words.txt /wordcount/input/words.txt

目录如果不存在可以创建

hadoop fs -mkdir -p /wordcount/input

结束后可以删除测试文件夹

hadoop fs -rm -r /wordcount

val textFile = sc.textFile("hdfs://node01:8020/wordcount/input/words.txt")
val counts = textFile.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _)
counts.saveAsTextFile("hdfs://node01:8020/wordcount/output")

发布了295 篇原创文章 · 获赞 184 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42072754/article/details/105274071

Apache Spark 初体验

spark 初体验

Spark SQL初体验

spark初体验

Spark -- Spark SQL初体验

Spark系列一：初体验

Apache Phoenix 安装初体验

Spark2.1.0——Spark初体验

Spark-shell初体验：WordCount

Spark2.1.0之初体验

【Spark学习】Partitioner分区器初体验

Apache-OFBIZ初体验（HelloWorld）

《从0到1学习spark》-- spark初体验

Apache Spark

Spark SQL初体验_第二章

Spark SQL:从入门到精通(一)[SparkSQL初体验]

apache mina第一发-初体验

org.apache.commons.pool2 初体验之GenericKeyedObjectPool

快速搭建Spark环境之local本地模式-Spark初体验（2）

[Spark笔记]Apache Spark — Overview

Apache Spark Spark VS Hadoop

Apache Spark 入门简介

Apache Spark 入门

[Apache Spark Error Message]

Apache Spark源码剖析

Apache Spark开发介绍

Apache Spark入门攻略

Apache Spark安装部署

Apache Spark机器学习

Apache Spark 概述

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)