大数据||Hive中常用的查询 - 代码天地

大数据||Hive中常用的查询

其他 2018-05-10 21:30:02 阅读次数: 4

Hive中的查询 Select

查询语法

 
  SELECT [ALL | DISTINCT] select_expr, select_expr, ... 
 

 
  FROM table_reference

 
  [WHERE where_condition]

 
  [GROUP BY col_list]

 
  [ORDER BY col_list]

 
  [CLUSTER BY col_list

 
  | [DISTRIBUTE BY col_list] [SORT BY col_list]

]

 
  [LIMIT [offset,] rows]

基本查询

select * from emp;
select t.empno,t.ename,t.deptno from emp t;

limit

select * from emp limit 5;

区间查询between and

select * from emp e where e.sal between t.sal=10 and t.sal =1500;

空查询is null

select t.empno,t.ename,t.deptno from emp t where t.deptno is null

不空查询is not null

select t.empno,t.ename,t.deptno from emp t where t.deptno is not null

集合查询in

select t.empno,t.ename,t.deptno from emp t where t.ename in ('lizh','forrest');

不在集合范围内not in

select t.empno,t.ename,t.deptno from emp t where t.ename not in ('lizh','forrest');

函数查询

最高工资max
select max(sal) from emp e; 
最低工资min
select min(sal) from emp e;  
总人数count
select count(*) from emp e;
公司月总支出sum
select sum(sal) from emp e;
平均工资avg
select avg(sal) from emp e;  

高级查询

分组group by

每个部门的平均工资

select e.deptno,avg(e.sal) from emp e  group by e.deptno;

having

where:是针对单条记录进行筛选。

having是针对分组数据进行筛选

求每个部门平均工资大于2000的数据

'select e.deptno,avg(e.sal) avgsal from emp e  group by e.deptno having avgsal>2000;'

join

两个表进行连接，例如有两个表m n ,m表中的一条记录和n表中的一条记录组成一条记录。

join on ：等值连接

bin/hive -e 'select e.empno,e.ename, d.deptno,d.dname from emp e join dept d on e.deptno = d.deptno;'

left join：左连接

说明：左连接表示以join左边数据为主，若join右边的数据不存在则补空。

bin/hive -e 'select e.empno,e.ename, d.deptno,d.dname from emp e left join  dept d on e.deptno = d.deptno;'

right join

说明：右连接表示以join左边数据为主，若join左边的数据不存在则补空。

bin/hive -e 'select e.empno,e.ename, d.deptno,d.dname from emp e right join  dept d on e.deptno = d.deptno;'

猜你喜欢

转载自blog.csdn.net/qq_16095837/article/details/79465594

大数据||Hive中常用的查询

大数据--hive查询

大数据之Hive:其他常用查询函数

大数据中常用脚本--cut

大数据中常用脚本--grep

大数据中常用脚本--sort（二）

大数据中常用脚本--sort（一）

大数据中常用脚本--解压

大数据中常用脚本--awk

大数据工作中常用的20条语句（hive，yarn，Linux，正则表达式等）

Hive中常用函数

大数据技术Hive内部函数常用简介及查询语法（第五篇）

大数据之Hive:其他常用查询函数之Rank

大数据之Hive:其他常用查询函数之窗口函数

大数据之Hive:其他常用查询函数之列转行

大数据之Hive:其他常用查询函数之行转列

大数据:hive4:查询

大数据软件安装之Hive（查询）

大数据技术学习笔记之hive框架基础2-hive中常用DML和UDF和连接接口使用

【大数据Hive】hive 加载数据常用方案使用详解

大数据：Hive常用参数调优

入门大数据---Hive常用DML操作

入门大数据---Hive常用DDL操作

大数据Hive系列之Hive常用SQL

大数据Hadoop集群中常用的任务调度框架

大数据分析中常用的方法有哪些

大数据技术之数据仓库工具Hive查询

django中常用的数据查询方法

数据库表中常用的查询实验

大数据（二十一）：hive查询语句

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)