使用spark访问elasticsearch的数据 - 代码天地

使用spark访问elasticsearch的数据

编程语言 2018-05-13 01:19:43 阅读次数: 0

使用spark访问elasticsearch的数据，前提是spark能访问hive，hive能访问es
http://blog.csdn.net/ggz631047367/article/details/50445832

1.配置

cp elasticsearch-hadoop-2.1.1/dist/elasticsearch-hadoop-2.1.1.jar /usr/local/spark-1.5.2/lib/

2.修改配置文件/usr/local/spark/conf/hive-site.xml,添加

<property>
<name>hive.aux.jars.path</name>
<value>file:///usr/local/spark-1.5.2/lib/elasticsearch-hadoop-2.1.1.jar</value>
<description>A comma separated list (with no spaces) of the jar files</description>
</property>

3.配置/usr/local/hive-1.2.1/lib/MySQL-connector-java-5.1.31-bin.jar,在spark-env.sh添加

export SPARK_CLASSPATH=$SPARK_CLASSPATH:/usr/local/hive-1.2.1/lib/mysql-connector-java-5.1.31-bin.jar

4.启动

sbin/start-thriftserver.sh --hiveconf hive.server2.thrift.port=10000 --hiveconf hive.server2.thrift.bind.host=hadoop-master --master spark://10.8.2.100:7077 --jars /usr/local/spark-1.5.2/lib/elasticsearch-hadoop-2.1.1.jar

或者

bin/spark-sql –master spark://10.8.2.100:7077 –jars /usr/local/spark-1.5.2/lib/elasticsearch-hadoop-2.1.1.jar

5.测试

beeline -u jdbc:hive2://10.8.2.100:10000 (稍等一下执行此命令，报错有可能是服务还没起来)

select count(dtime) from achi_ex limit 10;

注意：–driver-class-path和–jars的区别，使用sbin/start-thriftserver.sh -h查看
如果1中拷贝到所有slave中spark/lib中，后面不用—jars指定jar包

这种方式比直接访问hive中的数据慢一倍左右

http://blog.csdn.net/ggz631047367/article/details/50445790

http://blog.csdn.net/stark_summer/article/details/49743687

猜你喜欢

转载自m635674608.iteye.com/blog/2292570

使用spark访问elasticsearch的数据

如何使用Spark快速将数据写入Elasticsearch

spark 推送数据至 elasticsearch

ElasticSearch中如何使用Spark

Elasticsearch安装并使用Postman访问

Spark 2.0 保存数据到Elasticsearch 6

记Spark写数据到Elasticsearch的报错

elasticsearch使用spark sql来实现join

ElasticSearch的安装及数据的使用

使用java访问elasticsearch创建索引

使用rest api访问elasticsearch6

spark sql 访问hive数据的配置详解

spark sql 访问Hive数据表

使用spark访问hive进行开发

Spark SQL 使用beeline访问hive仓库

elasticsearch数据迁移——elasticsearch-dump使用

Elasticsearch：使用 Elasticsearch ingest pipeline 丰富数据

大数据学习整理篇（七）Linux下使用Docker搭建Spark多节点，Phoenix单机版，然后使用Spark访问Phoenix(java示例成功版）

Spark向Elasticsearch批量导入数据，出现重复的问题定位

spark将数据写入ES（ElasticSearch）终极总结

使用Akka来优化Spark+ElasticSearch的准实时系统

elasticsearch数据库使用

使用JPA访问数据

大数据之Spark（八）--- Spark闭包处理，部署模式和集群模式，SparkOnYarn模式，高可用，Spark集成Hive访问hbase类加载等异常解决，使用spark下的thriftserv

大数据学习整理篇（三）Ubuntu 16.04 Server版安装Kudu,Impala,Spark 2.3.4,以及Scala语言使用Spark RDD访问HBase

大数据开发-Docker-使用Docker10分钟快速搭建大数据环境,Hadoop、Hive、Spark、Hue、Kafka、ElasticSearch.....

Spark 整合ElasticSearch

spark 写入 elasticsearch 错误

spark 写入单机elasticsearch

Spark读写Elasticsearch

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)