实战详解使用IDE开发Spark程序 - 代码天地

实战详解使用IDE开发Spark程序

其他 2018-05-10 14:06:11 阅读次数: 1

1、打开Scala IDE for Eclipse的官网，官网地址：http://scala-ide.org/

2、点击Download IDE。

3、下载对应的版本。

4、scala-SDK-4.3.0-vfinal-2.11-win32.win32.x86_64.zip为例，解压缩。

5、双击打开eclipse.exe。

6、选择一个工作目录，然后点击OK。

7、在打开的窗口中，File -> New -> Scala Project。

8、写好Project name，点击Next。

9、点击Finish。

10、修改JRE System Library。

11、右击JRE System Library -> Build Path -> Configure Build Path...。

12、点击JRE System Library -> Edit。

13、选择Alternate JRE -> Installed JREs...。

14、点击Add...。

15、选择Standard VM，点击Next。

16、点击Directory...，选择本地文件安装JDK的安装目录，点击Finish。

17、选择刚才加入的JDK，点击OK。

18、下拉列表里选择刚才加入的JDK，点击Finish。

19、点击OK。

20、设置Scala library container。

21、项目上有右击 -> Properties。

22、打开的窗口点击Scala Compiler。

23、Use Project Settings打钩，打开Scala Installation下拉列表，选择Latest 2.10 bundle(dynamic)，点击OK。

24、点击OK。

25、下载spark-1.6.0-bin-hadoop2.6.tgz，解压spark-1.6.0-bin-hadoop2.6.tgz，解压以后目录如下：

26、添加Spark的jar依赖，项目右击 -> Build Path -> Configure Build Path...。

27、点击Libraries -> Add External JARs...。

28、选择lib目录下的spark-assembly-1.6.0-hadoop2.6.0.jar文件，点击打开。

29、点击OK。

30、项目里创建包，右击src -> New -> Package。

31、填写好Name，点击Finish。

32、创建Scala Object，右击com.dt.spark -> New -> Scala Object。

33、填写好Name，点击Finish。

34、开始编写WordCount，写Title。

35、添加main方法。

36、创建SparkConf对象，图里的第1步。

37、创建SparkContext对象，图里的第2步。

38、读取本地文件，图里的第3步

39、将每一行的字符串拆分成单个的单词，图里的第4.1步。

40、在单词拆分的基础上对每个单词实例计数为1，也就是word => (word, 1)，图里4.2步。

41、每个单词实例计数为1的基础之上统计每个单词在文件中出现的总次数，图里4.3步。

42、打印计算结果，图里的第5步。

43、关闭SparkContext，图里的第6步。

44、运行项目，右击WorkCount.scala文件 -> Run As -> Scala Application。

45、看见这样的结果，就代表成功了。

猜你喜欢

转载自www.cnblogs.com/frankdeng/p/9019206.html

实战详解使用IDE开发Spark程序

实战详解 IntelliJ IDEA下的Spark程序开发

SVD 详解与 spark实战

spark sortBy sortByKey实战详解

java开发实战视频详解

Flutter完整开发实战详解

第8课：使用ide开发spark程序

使用MyCat分库实战详解

spark 窗口函数(Window)实战详解

小程序开发实战（7）：Button组件详解

Android网络开发技术实战详解

wxPython 开发实战之 Font 详解

Node.Js开发实战详解

Python实战之logging模块使用详解

Python实战之unittest使用详解

Flutter完整开发实战详解(十六、详解自定义布局实战)

Conflux 开发教程 | 使用 IDE 在 Conflux 开发 DApp 的实战操作指南

Spark的DataFrame和Schema详解和实战案例Demo

深入掌握Git与实战开发2018（Git应用开发详解）

Spark应用程序开发参数调优深入剖析-Spark商业调优实战

第58课：使用Java和Scala在IDE中开发DataFrame实战

程序猿必知必会-MySQL 8.0详解与实战完整

Ajax+PHP程序设计实战详解

程序猿必知必会-MySQL 8.0详解与实战

4 springMVC详解（项目实战1-入门程序）

Android底层开发技术实战详解——内核、移植和驱动

Flex+PHP RIA应用开发实战详解

实战开发中springmvc常用注解标签详解

Flutter完整开发实战详解(三、打包与填坑篇)

vue开发实战2.0.1——vue配置文件详解

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)