SQL的技巧

衍生特征时, 统计每个类目id的用户的购买次数、金额, 用了下面语法, 发现效率很低.

select UID
, sum(if(item_level1_id='1', order_cnt, 0)) sum_cnt_level1_id_1
, sum(if(item_level1_id='2', order_cnt, 0)) sum_cnt_level1_id_2
...
from TABLE
group by UID

更改, 先用聚合的concat把结果存在一个字符串中, 在从字符串中取出字段值, 效率大为提升.
猜测原理是, 多个聚合函数导致重复计算. 改为一个稍微复杂的函数, 仍然很快. 时间从2小时变为20分钟.

select UID
, sum(if(item_level1_id='1', order_cnt, 0)) sum_cnt_level1_id_1
, sum(if(item_level1_id='2', order_cnt, 0)) sum_cnt_level1_id_2
...
from TABLE
group by UID

猜你喜欢

转载自www.cnblogs.com/bregman/p/10424411.html