在zepplin 使用spark sql 查询mongodb的数据 - 代码天地

在zepplin 使用spark sql 查询mongodb的数据

其他 2018-05-02 18:17:32 阅读次数: 3

1.下载zepplin

进入官网下载地址 ,下载完整tar包.

2.解压

tar zxvf zeppelin-0.7.3.tgz

3.修改配置

新建配置文件

cp zeppelin-env.sh.template zeppelin-env.sh

修改配置文件

vi zeppelin-env.sh

# 设置java home 路径

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.141-1.b16.el7_3.x86_64/jre

# 设置spark master 地址

export MASTER=spark://10.100.12.16:7077

# 设置spark home 路径

export SPARK_HOME=/opt/spark/

# 设置spark mongodb connector, 注意：这里用的是2.2.2版本

export SPARK_SUBMIT_OPTIONS="--packages org.mongodb.spark:mongo-spark-connector_2.11:2.2.2"

4.启动zepplin

bin/zeppelin-daemon.sh start

5.用浏览器进入zepplin后台:http://localhost:8080

6.点击notebook,新建查询.

7.写scala 查询代码

import com.mongodb.spark.config.ReadConfig
import com.mongodb.spark.sql._
val config = sqlContext.sparkContext.getConf
.set("spark.mongodb.keep_alive_ms", "15000")
.set("spark.mongodb.input.uri", "mongodb://10.100.12.14:27017")
.set("spark.mongodb.input.database", "bi")
.set("spark.mongodb.input.collection", "userGroupMapping")
val readConfig = ReadConfig(config)
val objUserGroupMapping = sqlContext.read
.format("com.mongodb.spark.sql")
.mongo(readConfig)
objUserGroupMapping.printSchema()
val tbUserGroupMapping=objUserGroupMapping.toDF()
tbUserGroupMapping.registerTempTable("userGroupMapping")

8.返回查询结果

猜你喜欢

转载自www.cnblogs.com/chengjunhao/p/8981695.html

在zepplin 使用spark sql 查询mongodb的数据

zepplin的安装及使用

zepplin实战

数据挖掘工具---Spark SQL使用

Spark学习之使用Spark SQL读取数据库

zepplin学习笔记一

Spark - SQL查询文件数据

Spark 04 Spark SQL 使用

基于Spark1.6使用Spark SQL和sqlite数据库进行诗歌查询及自动集句

spark sql 使用hive作为数据源

使用Spark SQL 探索“全国失信人数据”

6.3 使用Spark SQL读写数据库

大数据-Spark SQL

spark SQL 读取文件,进行SQL查询

spark学习笔记2（使用spark Sql进行离线数据分析项目）

【Spark学习】使用Spark SQL操作外部hive数据库

利用Spark sql操作Hdfs数据与Mysql数据，sql窗口函数的使用

【Spark九十四】spark-sql工具的使用

spark streaming 中使用 spark sql

springboot使用 no sql mongodb

改进版基于Spark2.2使用Spark SQL和mysql数据库进行诗歌查询及自动集句

Spark SQL整合Hive使用

使用IDEA开发Spark SQL

使用SQL语句查询Elasticsearch索引数据

Spark SQL数据源

MongoDB 数据类型查询——$type使用

Spark -- Spark SQL 简介数据抽象

生产环境_使用Scala语言_Spark编写灵活的SQL查询生成器

Spark SQL（二十三）Spark SQL数据源

Spark 实战，第 3 部分: 使用 Spark SQL 对结构化数据进行统计分析

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)