Streaming+Sparksql使用sql实时分析 rabbitmq+mongodb+hive - 代码天地

Streaming+Sparksql使用sql实时分析 rabbitmq+mongodb+hive

其他 2019-08-13 10:52:03 阅读次数: 0

SparkConf sparkConf = new SparkConf()
//此处使用一个链接切记使用一个链接否则汇报有多个sparkcontext错误
        .setAppName("SparkConsumerRabbit")
        .setMaster("local[2]")
        .set("hive.metastore.uris", thrift)
        .set("spark.sql.warehouse.dir", hdfs)
        .set("spark.mongodb.input.uri", "mongodb://" + rule.getMUName(jsonStr) + ":" + rule.getMpwd(jsonStr) + "@" + rule.getMIp(jsonStr) + ":" + rule.getMport(jsonStr) + "/" + rule.getMDBName(jsonStr) + "." + rule.getMtable(jsonStr))
        .set("spark.mongodb.output.uri", "mongodb://root:[email protected]:27010/pachong.test");
JavaSparkContext sc = new JavaSparkContext(sparkConf);
//Duration参数秒
//Streaming 方式
JavaStreamingContext jsc = new JavaStreamingContext(sc, Durations.seconds(5));
//hivesql 方式
HiveContext hiveContext = new HiveContext(sc);
hiveContext.sql("show databases").show();
hiveContext.sql("use" + " " + db);
//mongodb 方式
JavaMongoRDD<Document> rdd = MongoSpark.load(sc);
Map<String, String> params = new HashMap<>();
//map中参数设置，加载map连接rabbit
params.put("hosts", "192.168.7.96");
params.put("port", "5672");
params.put("userName", "admin");
params.put("password", "admin");
params.put("queueName", "cj_ack");
params.put("durable", "false");
Function<QueueingConsumer.Delivery, String> handler = message -> new String(message.getBody());
JavaReceiverInputDStream<String> messages = RabbitMQUtils.createJavaStream(jsc,String.class,params,handler);
messages.print();

猜你喜欢

转载自www.cnblogs.com/Mr--zhao/p/11344372.html

Streaming+Sparksql使用sql实时分析 rabbitmq+mongodb+hive

实时分析系统(HIVE/HBASE/IMPALA)浅析

大数据流处理与实时分析:Spark Streaming和Flink Stream SQL的对比与选择

新闻实时分析系统Hive与HBase集成进行数据分析

比Hive快800倍！大数据实时分析领域黑马开源ClickHouse

SparkSql整合Hive,使用idea运行,启动时报:"org.apache.spark.sql.hive.HiveSessionStateBuilder"

07 使用sparksql访问hive

给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤（图文详解）给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤（图文详解）

linux centos docker mysql redis mongodb rabbitmq配置基本使用

【SparkSQL】介绍、与Hive整合、Spark的th/beeline/jdbc/thriftserve2、shell方式使用SQL

使用spark将hive中的数据导入到mongodb

实时分析

TableStore实战：DLA+SQL实时分析TableStore

Flink Sql on Zeppelin（6）——Hive Streaming

Hive & SparkSQL

新闻网大数据实时分析可视化系统项目——12、Hive与HBase集成进行数据分析

SparkSql使用内部集成hive访问hbase

Hive安装与简单使用并集成SparkSQL

使用idea, sparksql读取hive中的数据

hive Streaming

使用ELK实时分析SSH暴力破解

Hadoop的实时分析之路

CDN日志实时分析

ELK日志实时分析

图书热度实时分析

hive sql 的总结分析

Spark1.4.0-SparkSQL与Hive整合-支持窗口分析函数

使用docker compose部署日常开发环境 redis mysql postgresql rabbitmq mongodb

sparksql\hive on spark\hive on mr

SparkSQL & Spark on Hive & Hive on Spark

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)