一 序
本文属于极客时间Elasticsearch核心技术与实战学习笔记系列。
本节课简单介绍ES聚合分析。
二 聚合(Aggregation)
Kibana 可视化报表 就是基于 Aggregation实现。
集合的分类
- Bucket Aggregation - 一些列满足特定条件的文档的集合
- Metric Aggregation - 一些数学运算,可以对文档字段进行统计分析
- Pipeline Aggregation - 对其他的聚合结果进行二次聚合
- Matrix Aggregation - 支持对多个字段的操作并提供一个结果矩阵
metric bucket
- Metric - 一些系统的统计方法(类似 count)
- Bucket - 一组满足条件的文档(group by)
Bucket
一些例子
- 杭州属于浙江 / 演员是男或女
- 嵌套关系 - 杭州属于浙江属于中国属于亚洲
ES 提供了许多的类型的 Bucket,帮助用多种方式划分文档
- Tern & Range (时间 / 年龄区间 / 地理位置)
metric
- Metric 会基于数据集计算结果,除了支持在字段上进行计算,同样也支持在脚本(painless script)产生的结果之上进行计算
- 大多数 Metric 是数学计算,仅输出一个值
- min / max / sum / avg /cardinality
- 部分 metric 支持输出多个数值
- stats / percentiles / percentile_ranks
demo
航班目的地份桶统计
查看航班目的地的统计信息,增加平均,最高最低价格