【Spark】Windows运行本地spark程序——JAVA版本 - 代码天地

【Spark】Windows运行本地spark程序——JAVA版本

其他 2019-03-11 22:13:51 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/sdut406/article/details/87898908

说明

为了运行spark程序我搭建了一个虚拟机的集群，但是我8G的内存被吃满了。。。别说跑个程序，就是基本运行都卡的不行。。。。。最后，我突然知道的本地也是可以运行spark的，，，，，唉费虚拟机呢么大劲干嘛。。。。
SO，如果你只是学习spark的基础知识，本地完全够用。还快速！！！！

搭建Windows的spark环境

下载hadoop 地址：http://archive.apache.org/dist/hadoop/core/ 各个版本都有，我下载的2.7.1
下载winutils 地址：https://github.com/steveloughran/winutils 这个是一个大神做的
java的版本1.7+
下载的hadoop解压到一个目录即可，然后把下载的winutils的bin目录复制到hadoop的bin目录，如果提示文件已存在，直接覆盖！
注意：一定要版本对应！！！！

运行spark

环境搭建好我们就可以运行spark的代码了，

搭建maven的java项目，在pom.xml添加

 <dependency>
     <groupId>org.apache.spark</groupId>
     <artifactId>spark-core_2.11</artifactId>
     <version>2.2.1</version>
 </dependency>

示例代码：

 // 指定hadoop的目录
 System.setProperty("hadoop.home.dir","F:\\hadoop-2.7.1");

 SparkConf conf = new SparkConf().setMaster("local").setAppName("TestSpark");
 JavaSparkContext sc = new JavaSparkContext(conf);


 JavaRDD<Integer> intRDD = sc.parallelize(Lists.newArrayList(1,2,3,4,5));

 JavaRDD<Integer> relRDD = intRDD.map(new Function<Integer, Integer>() {
     public Integer call(Integer integer) throws Exception {
         return integer+10;
     }
 });
 relRDD.foreach(new VoidFunction<Integer>() {
     public void call(Integer integer) throws Exception {
         System.out.println("relRDD---->:"+integer);
     }
 });

结果：

猜你喜欢

转载自blog.csdn.net/sdut406/article/details/87898908

【Spark】Windows运行本地spark程序——JAVA版本

IDEA创建本地Spark程序，并本地运行

Spark在Windows下运行，本地提交sp…

Spark java本地程序开发

Maven打包Java版的spark程序到jar包，本地Windows测试，上传到集群中运行

spark之spark本地运行

eclipse开发spark程序配置本地运行

Idea 本地运行spark程序参数配置

idea本地运行spark

本地调试spark程序

windows版本配置本地spark时，配置hadoop路径

IDEA开发java版本spark程序

Spark之IntelliJ IDEA搭建与spark应用程序创建与运行（本地运行）

如何在本地使用scala或python运行Spark程序

spark 本地调试运行

Windows本地运行调试Spark或Hadoop程序失败：ERROR util.Shell: Failed to locate the winutils binary in the hadoop binary path

spark本地环境的搭建到运行第一个spark程序

Spark-on-YARN运行Spark程序

windows系统使用eclipse搭建本地spark的java开发环境

spark的运行模式之 ==> 本地运行模式

IDEA spark程序本地调试

IDEA在本地运行wordCount spark程序报错：Exception in thread "main" java.lang.UnsatisfiedLinkError:org.apache.h

java使用spark2开发本地测试的wordCount程序

Java本地模式开发Spark程序开发遇到的问题

eclipse或idea中开发spark程序本地运行以及提交集群运行

详解Java编写并运行spark应用程序的方法

运行Spark程序，java.lang.ClassNotFoundException的解决

Eclipse IDE 使用Java语言运行Spark程序

spark程序运行报错：java.lang.NoSuchMethodError:

如何在IntelliJ IDEA中运行Java/Scala/Spark程序

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)