大数据学习整理篇（九）idea创建可以使用scala和java在spark运行的示例 - 代码天地

大数据学习整理篇（九）idea创建可以使用scala和java在spark运行的示例

其他 2021-02-01 00:17:44 阅读次数: 0

1.新建Java的maven工程

后续把groupid和artifactid和版本定义好就行

2.定义pom文件，添加具体jar包

请查看上篇文章整理篇（八）https://blog.csdn.net/penker_zhao/article/details/108361732

scala需要增加新的打包文件，加入到pom文件，具体如下：

<plugin>
          <groupId>org.scala-tools</groupId>
          <artifactId>maven-scala-plugin</artifactId>
          <executions>
            <execution>
              <goals>
                <goal>compile</goal>
                <goal>testCompile</goal>
              </goals>
            </execution>
          </executions>
        </plugin>

3.添加scala目录

在src/main下面添加scala目录，如下图所示：

4.标记scala目录为source root，并且添加scala的SDK库

右键选中scala目录，如下图所示，进行source root标记

在【File】-【Project Structure】标记SDK库，注意scala版本，我的pom文件是scala 2.11.*版本，所以，你的SDK也必须是scala 2.11.* SDK，如下图所示，添加Scala SDK 2.11.*版本：

5.最后能跟整理篇【七】java示例运行即可。请参考整理篇【七】

整理篇（七）Linux下使用Docker搭建Spark多节点，Phoenix单机版，然后使用Spark访问Phoenix(java示例成功版）

6.代码示例已经提交到gitee

https://gitee.com/astra_zhao/spark-zeppelin-learn

可以下载自己体验

FAQ:1.org.apache.hadoop.security.authentication.util.KerberosUtil.hasKerberosKeyTab(Ljavax/security/auth/Subject;) 报错

添加：

<!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-common -->
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.8.4</version>
        </dependency>

参考：https://www.cnblogs.com/sweetchildomine/p/9690106.html

猜你喜欢

转载自blog.csdn.net/penker_zhao/article/details/108362013

大数据学习整理篇（九）idea创建可以使用scala和java在spark运行的示例

大数据学习整理篇（七）Linux下使用Docker搭建Spark多节点，Phoenix单机版，然后使用Spark访问Phoenix(java示例成功版）

大数据学习整理篇（三）Ubuntu 16.04 Server版安装Kudu,Impala,Spark 2.3.4,以及Scala语言使用Spark RDD访问HBase

大数据学习整理篇（十一）spark和Hbase大数据Docker文件的迁移（成功版）

使用java和scala编写spark-WordCount示例

大数据入门——scala两种单词统计方法代码详解和运行结果分析（idea运行和spark集群运行）

大数据学习(十九)spark wordCount (java + scala)

大数据学习整理篇（十三）Ubuntu16.04安装jupyter notebook使用以及安装可以在notebook运行的R语言

大数据学习整理篇（八）Zeppelin连接Spark

大数据学习整理篇（十二）spark和Hbase在Docker不同主机环境和同主机下的简单应用

大数据学习(十六)idea配置Scala

如何在IntelliJ IDEA中运行Java/Scala/Spark程序

使用IntelliJ IDEA编写Scala在Spark中运行

idea基于maven 和scala创建spark项目

大数据学习整理篇（十）大数据应用场景和展现方式整理

安装IDEA 可以使用80年

IntelliJ IDEA 可以使用中文了

Java TreeSet，HashSet 和 HashMap 可以使用 equals() 比较

大数据开发之Spark篇----idea上使用SparkSQL对Hive上的数据

【鱼授之以渔】如何创建数据库和表可以使用哪些关键字和约束

可以使用多少列创建索引？

学习Scala 进击大数据Spark生态圈

Scala 学习进击大数据Spark生态圈

(视频)Scala 学习进击大数据Spark生态圈

【转载】学习Scala 进击大数据Spark生态圈

学习大数据的第一步-搭建Scala开发环境，以及使用Intellij IDEA开发Scala程序

用idea工具scala 和 Java开发 spark案例：WordCount

IDEA 创建scala spark的Mvn项目

学习大数据：Scala

大数据技术——使用IDEA开发Scala程序

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)