11.8 spark SQL读取hive数据 - 代码天地

11.8 spark SQL读取hive数据

其他 2018-09-02 02:52:13 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u011418530/article/details/81628997

1，启动hdfs集群

2，启动hive

create database testdb 创建testdb库

关闭hive保留关键字检查功能：

set hive.support.sql11.reserved.keywords=false

创建一张userlog表：

CREATE TABLE IF NOT EXISTS testdb.userlog(

date string ,

timestamp string ,

user_id string ,

page_id string ,

扫描二维码关注公众号，回复： 3005831 查看本文章

channel string ,

action string

)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' ;

表中插入数据：加载本地数据到hive

load data local inpath '/root/resource/userLog' into table testdb.userlog;

hive中的测试操作：是用来和Spark core性能对比

查询page的PV

SELECT date,page_id,count(*) pv FROM userlog WHERE action = 'View' GROUP BY date, page_id ORDER BY pv DESC LIMIT 10;

查询page的UV

SELECT date, page_id, count(distinct(user_id)) uv FROM userlog WHERE action = 'View' GROUP BY date,page_id ORDER BY uv DESC LIMIT 3;

最热门的channel

SELECT date,channel,count(*) channelpv FROM userlog WHERE action = 'View' GROUP BY date, channel ORDER BY channelpv DESC LIMIT 10;

spark core操作：

1，启动spark

2，开启Hive的metaStore服务在~目录下 ./startHiveMetastoreService.sh启动

3，启动spark core ： ./spark-shell --master spark://node1:7077 --total-executor-cores 3

4、import org.apache.spark.sql.hive.HiveContext

val hc = new HiveContext(sc)

hc.sql("show databases").show //查看数据库结构

hc.sql("use testdb").show //切换到testdb库

hc.sql("SELECT date,page_id,count(*) pv FROM userlog WHERE action = 'View' GROUP BY date, page_id ORDER BY pv DESC LIMIT 10").show

猜你喜欢

转载自blog.csdn.net/u011418530/article/details/81628997

11.8 spark SQL读取hive数据

11.8

11.8扩展数据库

通过spark-sql快速读取hive中的数据

spark sql 读取hbase中数据保存到hive

spark读取hive数据-java

[Spark SQL]Spark SQL读取Kudu，写入Hive

SPARK Spark SQL读取hive数据时报找不到mysql驱动

hive on spark 读取json数据失败

Spark SQL 读取 Hive表中数据在Cluster模式下找不到库

Hive on Spark 与Spark SQL比较

Spark SQL与Hive on Spark的比较

Hadoop基础教程-第11章 Hive：SQL on Hadoop（11.8 HQL：排序）（草稿）

Spark SQL操作Hive数据库

spark sql 访问hive数据的配置详解

spark sql 访问Hive数据表

spark sql数据源--hive

Spark SQL数据源：Hive表

11.8 小结

11.8随笔

11.8~11.9

作业（11.8）

11.8作业

Spark SQL读取hbase映射到hive表-----异常记录

spark-sql读取不到parquet格式的hive表

Spark sql操作Hive

spark shell hive sql

Spark SQL整合Hive

【Hive进阶】-- Hive SQL、Spark SQL和 Hive on Spark SQL

spark sql 读取数据库并保存

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)