Hive(三)-内置函数-聚合函数

Return Type

Name(Signature)

Description

BIGINT

count(*),

count(expr),

count(DISTINCT expr[, expr...])


统计总行数,包括含有NULL值的行

统计提供非NULL的expr表达式值的行数

统计提供非NULL且去重后的expr表达式值的行数

DOUBLE

sum(col),

sum(DISTINCT col)

sum(col),表示求指定列的和,

sum(DISTINCT col)表示求去重后的列的和

DOUBLE

avg(col),

avg(DISTINCT col)

avg(col),表示求指定列的平均值,

avg(DISTINCT col)表示求去重后的列的平均值

DOUBLE

min(col)

求指定列的最小值

DOUBLE

max(col)

求指定列的最大值

DOUBLE

variance(col),

var_pop(col)

求指定列数值的方差

DOUBLE

var_samp(col)

求指定列数值的样本方差

DOUBLE

stddev_pop(col)

求指定列数值的标准偏差

DOUBLE

stddev_samp(col)

求指定列数值的样本标准偏差

DOUBLE

covar_pop(col1, col2)

求指定列数值的协方差

DOUBLE

covar_samp(col1, col2)

求指定列数值的样本协方差

DOUBLE

corr(col1, col2)

返回两列数值的相关系数

DOUBLE

percentile(BIGINT col, p)

返回col的p%分位数

猜你喜欢

转载自www.cnblogs.com/sunziying/p/9068875.html