Spark SQL 支持绝大部分的 Hive 功能

  • Hive 查询语句, 包括 :

SELECT
GROUP BY
ORDER BY
CLUSTER BY
SORT BY

  • 所有的Hive运算符, 包括 :

关系运算符 (=, ⇔, ==, <>, <, >, >=, <=, etc)
算术运算符 (+, -, *, /, %, etc)
逻辑运算符 (AND, &&, OR, ||, etc)
复杂类型构造器 - 数学函数 (sign, ln, cos等)
String 函数 (instr, length, printf等)

  • 用户自定义函数(UDF)
  • 用户自定义聚合函数(UDAF)
  • 用户自定义序列化格式(SerDes)
  • 窗口函数

  • Joins

JOIN
{LEFT|RIGHT|FULL} OUTER JOIN
LEFT SEMI JOIN - CROSS JOIN

  • Unions
  • 子查询

SELECT col FROM ( SELECT a + b AS col from t1) t2

  • 采样
  • Explain
  • 分区表,包括动态分区插入
  • 视图
  • 所有 Hive DDL 功能, 包括 :

CREATE TABLE
CREATE TABLE AS SELECT
ALTER TABLE

  • 绝大多数Hive数据类型,包括

TINYINT
SMALLINT
INT
BIGINT
BOOLEAN
FLOAT
DOUBLE
STRING
BINARY
TIMESTAMP
DATE
ARRAY<>
MAP<>
STRUCT<>

猜你喜欢

转载自blog.csdn.net/Alien_lily/article/details/82022085