Spark2.0操作ES - 代码天地

Spark2.0操作ES

其他 2018-12-10 20:20:56 阅读次数: 0

ES提供了支持包来方便的操作ES。首先添加ES的依赖maven：
<dependency>
           <groupId>org.elasticsearch</groupId>
           <artifactId>elasticsearch-spark-20_2.11</artifactId>
           <version>6.2.0</version>
           <exclusions>
               <exclusion>
                   <artifactId>log4j-over-slf4j</artifactId>
                   <groupId>org.slf4j</groupId>
               </exclusion>
           </exclusions>
        </dependency>

然后在Spark程序中设置SparkConf，将ES的属性设置好：

val sparkconf = new SparkConf().setAppName("sevs_spark3")
.set("spark.driver.userClassPathFirst", "true")
.set("spark.executor.userClassPathFirst", "true")
.set("HADOOP_USER_NAME", getProp("hbase.hadoop.username"))
.set("HADOOP_GROUP_NAME", getProp("hbase.hadoop.groupname"))
.set("es.index.auto.create", "true")
.set("es.nodes", "127.0.0.1")
.set("es.port", "9200")
.setMaster("local")

最后通过esRDD来读写ES，非常方便

def read_es(sc:SparkContext){
val rdd = sc.esRDD("test/login")
rdd.foreach(x=>{
println("######",x._1,x._2 )
})
}

def save_es(sc:SparkContext){
sc.parallelize(Seq("abc","def")).map(x=>{
val map = Map("hostIp" -> x, "remoteIp" -> x.concat("#"))
map
}).saveToEs("snprime_login/login")
}

Spark操作ES就是这么简单，赶快来试试吧。

猜你喜欢

转载自my.oschina.net/u/778683/blog/2986444

Spark2.0操作ES

Spark2.0操作Hbase

spark2.0的SparkSQLbug

Spark2.0 概念

深挖spark2.0

spark2.0访问ES5.1中的数据

解决升级Spark2.0之后，DataFrame map操作报错

spark2.0 AFTSurvivalRegression算法

Spark2.0 shuffle service

spark2.0搭建standalone集群模式

Spark2.0安装配置文档

Spark2.0学习（二）--------RDD详解

spark2.0 新特性总结

Spark2.0读写Cassandra数据(scala)

spark2.0在IDE运行的问题

Spark2.0集成Hive操作的相关配置与注意事项

spark2.0 连接mysql8.0数据库操作表数据

spark2.0版本的 DataFrame、DataSet 与 Spark sql

Spark2.0较于Spark1.x的更新之处

Spark实战（1）_Spark2.0环境搭建

scala spark2.0 sparksql 连接mysql8.0 操作多表使用 dataframe 及RDD进行数据处理

spark2.0 用socket接收数据并处理

Spark2.0版本神器Structured Streaming

图文解析Spark2.0核心技术(转载)

Spark2.0源码之2_TorrentBroadcast

Spark2.0源码之1_Broadcast

Spark2.0源码之4_Worker

Spark2.0源码之3_Master

CentOS7安装spark2.0集群

Spark2.0 一些新特性

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)