spark-sql 集成 hive - 代码天地

spark-sql 集成 hive

其他 2018-09-21 17:08:27 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/sunrising_hill/article/details/79476271

Hive目录下的hive-site.xml添加：

<property>
<name>hive.metastore.uris</name>
<value>thrift://hm.clusterdomain.com:9083</value>
<description>Thrift URI for the remote metastore. Used by metastore client to connect to remote metastore.</description>
</property>

将mysql驱动导入 /apps/spark/jars
将hive-site.xml导入 /apps/spark/conf，如果是集群，将配置文件上传至每台spark的配置目录中。

启动Hive的metastore:
nohup /apps/hive/bin/hive --service metastore &

修改spark-sql脚本，具体配置根据集群规模配置：
--executor-memory 4G --total-executor-cores 6 --executor-cores 2
修改后：
exec "${SPARK_HOME}"/bin/spark-submit --class org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver --executor-memory 4G --total-executor-cores 6 --executor-cores 2 "$@"

spark-sql即可直接使用sql语句查询hive数据表。

此时控制台会打印spark-sql翻译的sql job的所有日志信息，可以修改日志级别，只显示重要信息：
cd /apps/spark/conf
cp log4j.properties.template log4j.properties
vi log4j.properties

将
log4j.rootCategory=INFO, console
改为：
log4j.rootCategory=WARN, console

[hadoop@tomcatapi ~]$ spark-sql
18/03/07 20:23:22 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
18/03/07 20:23:35 WARN ObjectStore: Version information not found in metastore. hive.metastore.schema.verification is not enabled so recording the schema version 1.2.0
18/03/07 20:23:35 WARN ObjectStore: Failed to get database default, returning NoSuchObjectException
spark-sql>
>
> select count(*) from log.uservisitlogpartorc;
8984856
Time taken: 10.552 seconds, Fetched 1 row(s)
spark-sql>

猜你喜欢

转载自blog.csdn.net/sunrising_hill/article/details/79476271

spark-sql 集成 hive

spark on yarn & spark on hive & spark-sql on hive

Spark-sql结合hive使用详情

spark-sql on Hive的配置记录

spark sql集成hive步骤

Spark SQL精华及与Hive的集成

Spark on Hive / 为什么spark-sql比hive慢？

Hive、Beeline、Spark-SQL、Spark-Shell CLI使用

通过spark-sql快速读取hive中的数据

sparkf:spark-sql替换hive查询引擎

spark-sql读取不到parquet格式的hive表

Spark Hive集成maven

Spark 集成 Hive

Spark SQL与hive hbase mysql集成

集成Hive与Spark SQL及代码实现

Spark-Sql整合hive，在spark-sql命令和spark-shell命令下执行sql命令和整合调用hive

hive集成spark和mysql

Spark 2.4.0 集成Hive 1.2.1

spark集成外部hive（转载）

Spark集成Hive和mysql

SparkSQL（二）spark-shell和spark-sql以及thriftserver&beeline访问hive表

concat_ws 使用在hive spark-sql上的区别

Spark-Sql快速入门系列(5) | Hive数据库

在 spark-sql / spark-shell / hive / beeline 中粘贴 sql、程序脚本时的常见错误

spark-sql 中不能使用hive创建表，报/user/hive/warehouse is not a directory or unable to create one错误

5.4.0Spark和Hive集成(Derby)

5.4.1Spark和Hive集成(MySql)

SPARK2集成HIVE

同一个sql 在Hive和spark-sql 跑出结果不一样记录

Hive集成sentry的sql使用语法

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)