Elasticsearch 超强聚合查询(二)之天生的条形图数据

Elasticsearch 超强聚合查询二之天生的条形图数据

把数据转换为图表来显示,是我们在开发中经常要用到的,特别是在数据分析的时候,Elasticsearch有一个很好的特性:查询出来的数据格式能够很好的满足当下绝大多数图表的数据的Json数据格式.本篇文章将结合相关的案例来演示.

对于条形图,在聚合中的historgram函数特别适合,它的本质就是条形图.本文将结合上一篇的例子来进行案例演示.

案例一:以汽车的售价为x轴,每20,000为一个档次,需要知道每个售价区间的收入和汽车的销量.

最终的图片效果如下:

条形图 

  • 墨绿色条线表示销量,紫色的表示总的销售额度

在这里大家需要掌握extended_stats函数

  • http请求方式
GET /cars/transactions/_search
{
   "size" : 0,
   "aggs":{
      "price":{//聚合的名字,自己定义
         "histogram":{ //这个函数需要两个参数,一个是分组的字段,然后就是每个集合之间的区间间隔
            "field": "price",
            "interval": 20000//间隔2W
         },
         "aggs":{
            "revenue": {//销售总额的变量名,自己定义
               "sum": { 
                 "field" : "price"//累加的字段
               }
             }
         }
      }
   }
}```

* java-api的请求方式

```java
    @Test
    public void extendedStats(){
        SearchResponse response = transportClient.prepareSearch("cars")
                .setTypes("transactions")
                .addAggregation(
                    AggregationBuilders.histogram("price")//设置聚合的名字
                        .field("price")//字段
                        .interval(20000)//每个条形图的价格区间
                        .subAggregation(
                                AggregationBuilders.sum("revenue")//销售总额的变量名,自己定义
                                .field("price")//累加的字段
                        )

                )
                .setSize(0)
                .get();
    }




<div class="se-preview-section-delimiter"></div>
  • 返回的结果
{
...
   "aggregations": {
      "price": {
         "buckets": [
            {
               "key": 0,//代表0-19999区间
               "doc_count": 3,
               "revenue": {
                  "value": 37000
               }
            },
            {
               "key": 20000,//代表20000-40000区间
               "doc_count": 4,
               "revenue": {
                  "value": 95000
               }
            },
            //由于中间的价格区间的数据不存在,所以这边没有显示,也不会统计进来
            {
               "key": 80000,//代表80000-100000区间
               "doc_count": 1,
               "revenue": {
                  "value": 80000
               }
            }
         ]
      }
   }
}

案例二:计算10种汽车的平均售价,标准差,并用获得的数据创建一个条形图.

  • 最终的条线图如下: 
    条形图

  • http RestFull请求方式:

GET /cars/transactions/_search
{
  "size" : 0,
  "aggs": {
    "makes": {//取名字,用户自定义,到时候解析返回值的时候需要用到.
      "terms": {
        "field": "make",
        "size": 10//每个厂商取10个
      },
      "aggs": {
        "stats": {
          "extended_stats": {//Elasticsearch的计算函数
            "field": "price"//计算的字段名
          }
        }
      }
    }
  }
}

  • java-api的请求方式:
    @Test
    public void extendedStats_Second(){
        SearchResponse response = transportClient.prepareSearch("cars")
                .setTypes("transactions")
                .addAggregation(
                    AggregationBuilders.terms("makes")
                        .field("make")
                        .size(10)
                        .subAggregation(
                                AggregationBuilders.extendedStats("stats")//变量名自己定义
                                .field("price")
                        )
                )
                .setSize(0)
                .get();
    }
  • 返回的结果:
{
  ...
  "aggregations": {
    "makes": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
        {
          "key": "honda",
          "doc_count": 3,
          "stats": {
            "count": 3,
            "min": 10000.0,
            "max": 20000.0,
            "avg": 16666.666666666668,
            "sum": 50000.0,
            "sum_of_squares": 9.0E8,
            "variance": 2.222222222222221E7,
            "std_deviation": 4714.045207910315,
            "std_deviation_bounds": {
              "upper": 26094.757082487296,
              "lower": 7238.5762508460375
            }
          }
        },
        {
          "key": "toyota",
          "doc_count": 2,
          "stats": {
            "count": 2,
            "min": 12000.0,
            "max": 15000.0,
            "avg": 13500.0,
            "sum": 27000.0,
            "sum_of_squares": 3.69E8,
            "variance": 2250000.0,
            "std_deviation": 1500.0,
            "std_deviation_bounds": {
              "upper": 16500.0,
              "lower": 10500.0
            }
          }
        },
        {
          "key": "bmw",
          "doc_count": 1,
          "stats": {
            "count": 1,
            "min": 80000.0,
            "max": 80000.0,
            "avg": 80000.0,
            "sum": 80000.0,
            "sum_of_squares": 6.4E9,
            "variance": 0.0,
            "std_deviation": 0.0,
            "std_deviation_bounds": {
              "upper": 80000.0,
              "lower": 80000.0
            }
          }
        },
        {
          "key": "ford",
          "doc_count": 1,
          "stats": {
            "count": 1,
            "min": 30000.0,
            "max": 30000.0,
            "avg": 30000.0,
            "sum": 30000.0,
            "sum_of_squares": 9.0E8,
            "variance": 0.0,
            "std_deviation": 0.0,
            "std_deviation_bounds": {
              "upper": 30000.0,
              "lower": 30000.0
            }
          }
        }
      ]
    }
  }
}

补充说明

std.deviation:标准差 

猜你喜欢

转载自blog.csdn.net/tiansheng1225/article/details/81706219