spark on hive - 代码天地

spark on hive

其他 2018-10-31 10:31:55 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/haidao2009/article/details/49507651

很多时候用spark处理数据，处理完后需要写回hive 数据仓库。这时候用spark on hive 效率会高很多。

rdd 处理完后，
先创建一个schema

schema = StructType([
StructField(“item_id”,StringType(), True),
StructField(“feed_id”,StringType(), True),
………
StructField(“ds”,StringType(), True)]
)

然后rdd转换为hive df。注意是hive df 。不是sql df
df=hiveContext.createDataFrame(rdd,schema)
hiveContext.sql(‘use database’)
hiveContext.sql(‘SET hive.exec.dynamic.partition=true ‘)
hiveContext.sql(‘SET hive.exec.dynamic.partition.mode=nonstrict ‘)
hiveContext.sql(‘SET hive.exec.max.dynamic.partitions.pernode = 1000 ‘)
hiveContext.sql(‘SET hive.exec.max.dynamic.partitions=1000 ‘)
hiveContext.sql(‘set hive.exec.reducers.bytes.per.reducer=500000000 ‘)

dfw=DataFrameWriter(df)
dfw.partitionBy().insertInto(‘table’)
partitionBy 是分区表，如果没有，则直接insert。如果没有表，那就dfw.saveAsTable()直接写入

猜你喜欢

转载自blog.csdn.net/haidao2009/article/details/49507651

Spark -- Spark-On-Hive

Spark SQL:从入门到精通(六)[ Spark-On-Hive]

SparkSQL-SparkOneHive

hive on spark

spark on hive

SparkSQL & Spark on Hive & Hive on Spark

hive on spark 和spark on hive

spark-hive on spark

Spark：hive on spark

Spark_Spark On Hive

Spark_Spark On Hive

spark--Spark-On-Hive-★★★★★

hive集群配置 hive on spark

sparksql\hive on spark\hive on mr

SparkSQL & Spark on Hive & Hive on Spark[转载]

漫谈大数据 - Spark on Hive & Hive on Spark

Hive on Spark 与Spark SQL比较

Spark SQL与Hive on Spark的比较

CDH的 hive on spark（spark on yarn）

【Spark】Spark 访问连接 HIVE

hive spark conf

hive on spark 测试

Spark Hive集成maven

hive on spark的安装及问题

beeline 连接SPARK /Hive

Hive with Spark 实战

hive on spark 编译

Spark 与 Hive 的定义

hive on spark问题汇总

hive on spark部署

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)