（转）常用统计分析函数

(1)sum函数，统计总合
按照月份，统计每個地区的总收入
Sql代码

select earnmonth, area, sum(personincome)
from earnings
group by earnmonth,area;
查看结果如下：

(2)rollup函数
按照月份，地区统计收入，主要用于做小计合计
select earnmonth, area, sum(personincome)
from earnings
–group by rollup(area,earnmonth); ----该行代码计算出的结果是以城市group by的
group by rollup(earnmonth,area); ----该行代码计算出的结果是以月份group by的
查看结果如下：

group by 后面接 rollup 是在纯粹的 group by 分组上再加上对earnmonth的汇总统计。

(3)cube函数
按照月份，地区进行收入总汇总
Sql代码

select earnmonth, area, sum(personincome)
from earnings
–group by cube(earnmonth,area) ----括号中内容顺序对结果集没有影响
group by cube(area,earnmonth)
order by earnmonth,area nulls last; ---- nulls last 是把空值放在最后
结果如下：

group by 后面接 cube 是对earnmonth汇总统计基础上对area再统计。

rollup和cube区别：

如果是ROLLUP(A, B, C)的话，GROUP BY顺序
(A、B、C)
(A、B)
(A)
最后对全表进行GROUP BY操作。

如果是GROUP BY CUBE(A, B, C)，GROUP BY顺序
(A、B、C)
(A、B)
(A、C)
(A)，
(B、C)
(B)
©，
最后对全表进行GROUP BY操作。

(4)grouping函数
在以上例子中，是用rollup和cube函数都会对结果集产生null，这时候可用grouping函数来确认
该记录是由哪个字段得出来的
grouping函数用法，带一个参数，参数为字段名，如果当前行是由rollup或者cube汇总得来的，有结果就返回1，反之返回0
SELECT
(CASE WHEN grouping(EARNMONTH) =1 THEN ‘所有月份’
ELSE EARNMONTH END) “月份”,
(CASE WHEN grouping(AREA) =1 THEN ‘全部地区’
ELSE AREA END) “地区维度”,
sum(PERSONINCOME)“工资”
FROM EARNINGS
GROUP BY CUBE (EARNMONTH,AREA)
ORDER BY EARNMONTH,AREA NULLS LAST ;

(5)rank() over开窗函数:则是重复值所在行的序列值相同，但其后的序列值从重复行数开始递增
按照月份、地区，求打工收入排序
select
earnmonth 月份,
area 地区,
sname 打工者,
personincome 收入,
rank() over (partition by earnmonth,area order by personincome desc) 排名
from earnings;

(6)dense_rank() over开窗函数:在做排序时如果遇到列有重复值，则重复值所在行的序列值相同，而其后的序列值依旧递增
按照月份、地区，求打工收入排序2
select
earnmonth 月份,
area 地区,sname 打工者,
personincome 收入,
dense_rank() over (partition by earnmonth,area order by personincome desc) 排名
from earnings;

(7)row_number() over：不管是否有重复行，(分组内)序列值始终递增
按照月份、地区，求打工收入排序3
select
earnmonth 月份,
area 地区,
sname 打工者,
personincome 收入,
row_number() over (partition by earnmonth,area order by personincome desc) 排名
from earnings;

(8)sum累计求和
根据月份求出各个打工者收入总和，按照收入由少到多排序
select
earnmonth 月份,
area 地区,
sname 打工者,
sum(personincome) over (partition by earnmonth,area order by personincome) 总收入
from earnings;

(9)max，min，avg和sum函数综合运用
按照月份和地区求打工收入最高值，最低值，平均值和总额
select
distinct earnmonth 月份,
area 地区,
max(personincome) over(partition by earnmonth,area) 最高值,
min(personincome) over(partition by earnmonth,area) 最低值,
avg(personincome) over(partition by earnmonth,area) 平均值,
sum(personincome) over(partition by earnmonth,area) 总额
from earnings;

(10)lag和lead函数
求出每个打工者上个月和下个月有没有赚钱(personincome大于零即为赚钱)
select earnmonth 本月,
sname 打工者,
lag(decode(nvl(personincome,0),0,‘没赚’,‘赚了’),1,0) over(partition by sname order by earnmonth) 上月,
lead(decode(nvl(personincome,0),0,‘没赚’,‘赚了’),1,0) over(partition by sname order by earnmonth) 下月
from earnings;

说明：Lag和Lead函数可以在一次查询中取出某个字段的前N行和后N行的数据（可以是其他字段的数据，比如根据字段甲查询上一行或下两行的字段乙），原来没有分析函数的时候采用子查询方法，但是比较麻烦，惭愧，我用子查询有的还查不出来呢。

语法如下：
lag(value_expression [,offset] [,default]) over ([query_partition_clase] order_by_clause)；
lead(value_expression [,offset] [,default]) over ([query_partition_clase] order_by_clause)；
其中：
value_expression：可以是一个字段或一个内建函数。
offset是正整数，默认为1，指往前或往后几点记录．因组内第一个条记录没有之前的行，最后一行没有之后的行，
default就是用于处理这样的信息，默认为空。

再讲讲所谓的开窗函数，依本人遇见，开窗函数就是 over([query_partition_clase] order_by_clause)。比如说，我采用sum求和，rank排序等等，但是我根据什么来呢？over提供一个窗口，可以根据什么什么分组，就用partition by，然后在组内根据什么什么进行内部排序，就用 order by。

数据库建立语句及数据插入语句
本文讲述Oracle分析函数用法，首先建库：
Sql代码

create table earnings – 打工赚钱表
(
earnmonth varchar2(6), – 打工月份
area varchar2(20), – 打工地区
sno varchar2(10), – 打工者编号
sname varchar2(20), – 打工者姓名
times int, – 本月打工次数
singleincome number(10,2), – 每次赚多少钱
personincome number(10,2) – 当月总收入
)
然后插入实验数据：
Sql代码

insert into earnings values(‘200912’,‘北平’,‘511601’,‘大魁’,11,30,1130);
insert into earnings values(‘200912’,‘北平’,‘511602’,‘大凯’,8,25,825);
insert into earnings values(‘200912’,‘北平’,‘511603’,‘小东’,30,6.25,306.25);
insert into earnings values(‘200912’,‘北平’,‘511604’,‘大亮’,16,8.25,168.25);
insert into earnings values(‘200912’,‘北平’,‘511605’,‘贱敬’,30,11,30*11);

insert into earnings values(‘200912’,‘金陵’,‘511301’,‘小玉’,15,12.25,1512.25);
insert into earnings values(‘200912’,‘金陵’,‘511302’,‘小凡’,27,16.67,2716.67);
insert into earnings values(‘200912’,‘金陵’,‘511303’,‘小妮’,7,33.33,733.33);
insert into earnings values(‘200912’,‘金陵’,‘511304’,‘小俐’,0,18,0);
insert into earnings values(‘200912’,‘金陵’,‘511305’,‘雪儿’,11,9.88,119.88);

insert into earnings values(‘201001’,‘北平’,‘511601’,‘大魁’,0,30,0);
insert into earnings values(‘201001’,‘北平’,‘511602’,‘大凯’,14,25,1425);
insert into earnings values(‘201001’,‘北平’,‘511603’,‘小东’,19,6.25,196.25);
insert into earnings values(‘201001’,‘北平’,‘511604’,‘大亮’,7,8.25,78.25);
insert into earnings values(‘201001’,‘北平’,‘511605’,‘贱敬’,21,11,2111);

insert into earnings values(‘201001’,‘金陵’,‘511301’,‘小玉’,6,12.25,612.25);
insert into earnings values(‘201001’,‘金陵’,‘511302’,‘小凡’,17,16.67,1716.67);
insert into earnings values(‘201001’,‘金陵’,‘511303’,‘小妮’,27,33.33,2733.33);
insert into earnings values(‘201001’,‘金陵’,‘511304’,‘小俐’,16,18,1618);
insert into earnings values(‘201001’,‘金陵’,‘511305’,‘雪儿’,11,9.88,11*9.88);
然后看看刚刚建好的库：
Sql代码

select * from earnings;

（转）常用统计分析函数

猜你喜欢