ElasticSearch中如何使用Spark - 代码天地

ElasticSearch中如何使用Spark

其他 2020-04-24 15:09:24 阅读次数: 0

ElasticSearch是一个基于Lucene的搜索服务器, 它提供了一个分布式多用户能力的全文搜索引擎, 基于RESTful web接口, 底层是用Java开发的。

本文将通过Spark的方式来读取ES，基于以下版本开发测试。

scala-version：2.11.8

spark-version：2.2.0

elasticsearch-version：5.5.0

接下来正式开始了。

1. 添加Maven依赖

<dependencies>

     <dependency>
          <groupId>org.elasticsearch</groupId>
          <artifactId>elasticsearch-spark-20_2.11</artifactId>
          <version>6.2.4</version>
     </dependency>

</dependencies>

2. Spark 读取ES

import org.apache.spark.{SparkConf, SparkContext}
import org.elasticsearch.spark.rdd.EsSpark
object ES2Spark {

  def main(args: Array[String]): Unit = {

      val conf = new SparkConf().setMaster("local").setAppName("ES2Spark")
        .set("es.index.auto.create", "true")
        .set("es.nodes", "127.0.0.1")
        .set("es.port", "9200")

      val sc = new SparkContext(conf)

      val rdd = EsSpark.esJsonRDD(sc, "indexName", "?q=*1*")

      rdd.foreach(println(_))
      sc.stop()
  }
}

雷禄辉

发布了84 篇原创文章 · 获赞 28 · 访问量 6万+

私信关注

猜你喜欢

转载自blog.csdn.net/a544258023/article/details/89711376

ElasticSearch中如何使用Spark

如何使用Spark快速将数据写入Elasticsearch

spark on yarn 如何集成elasticsearch

在spring data中如何使用elasticsearch

使用spark访问elasticsearch的数据

elasticsearch如何使用？

spark读取elasticsearch中数组类型的字段

如何使用hive on spark

elasticsearch使用spark sql来实现join

ElasticSearch在springboot中的使用

elasticsearch在php中的使用

ElasticSearch 中boolQueryBuilder的使用

spark使用中的优化

linux中如何安装elasticsearch

Elasticsearch中数据是如何存储的

Elasticsearch 如何使用RESTful API

CDH中如何升级Spark

spark中如何划分stage

Elasticsearch 中如何巧妙地使用聚合函数达到数据库中having的效果

ElasticSearch(5.5.2)在java中的使用

Elasticsearch中Head插件的使用

elasticsearch在C#中的使用

elasticsearch中ik分词的使用

elasticSearch 在 SpringBoot中的使用（三）

ElasticSearch在开发中的使用总结

使用Akka来优化Spark+ElasticSearch的准实时系统

spark中缓存cache的使用

[Spark] RDD中JOIN的使用

Spark中DataSet的基本使用

Spark中SimpleDateFormat的安全使用

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)