进阶-第32__深入聚合数据分析_bucket与metric两个核心概念的讲解 - 代码天地

进阶-第32__深入聚合数据分析_bucket与metric两个核心概念的讲解

其他 2019-03-15 09:11:04 阅读次数: 0

课程大纲

1、文本编辑器介绍

（1）windows操作系统，原生的txt文本编辑器，一些json格式，不太方便去调整

（2）notepad++，功能不是太丰富

（3）sublime，整个功能也比较丰富，比较好，自己可以上网去下载，官网，免费的

2、两个核心概念：bucket和metric

bucket：一个数据分组

city name

北京小李

北京小王

上海小张

上海小丽

上海小陈

基于city划分buckets

划分出来两个bucket，一个是北京bucket，一个是上海bucket

北京bucket：包含了2个人，小李，小王

上海bucket：包含了3个人，小张，小丽，小陈

按照某个字段进行bucket划分，那个字段的值相同的那些数据，就会被划分到一个bucket中

有一些mysql的sql知识的话，聚合，首先第一步就是分组，对每个组内的数据进行聚合分析，分组，就是我们的bucket

metric：对一个数据分组执行的统计

当我们有了一堆bucket之后，就可以对每个bucket中的数据进行聚合分词了，比如说计算一个bucket内所有数据的数量，或者计算一个bucket内所有数据的平均值，最大值，最小值

metric，就是对一个bucket执行的某种聚合分析的操作，比如说求平均值，求最大值，求最小值

select count(*)

from access_log

group by user_id

bucket：group by user_id --> 那些user_id相同的数据，就会被划分到一个bucket中

metric：count(*)，对每个user_id bucket中所有的数据，计算一个数量

猜你喜欢

转载自blog.csdn.net/qq_35524586/article/details/88553802

进阶-第32__深入聚合数据分析_bucket与metric两个核心概念的讲解

进阶-第34__深入聚合数据分析_实战bucket+metric：统计每种颜色电视平均价格

进阶-第40__深入聚合数据分析_global bucket：单个品牌与所有品牌销量对比

进阶-第57__深入聚合数据分析_海量bucket优化机制：从深度优先到广度优先

进阶-第42__深入聚合数据分析_bucket filter：统计牌品最近一个月的平均价格

第十六篇深入elasticsearch聚合数据分析

进阶-第51__深入聚合数据分析_基于doc value正排索引的聚合内部原理

进阶-第53__深入聚合数据分析_string field聚合实验以及fielddata原理初探

进阶-第52__深入聚合数据分析_doc value机制内核级原理深入探秘

进阶-第50__深入聚合数据分析_percentiles rank以及网站访问时延SLA统计

进阶-第54__深入聚合数据分析_fielddata内存控制以及circuit breaker断路器

进阶-第46__深入聚合数据分析_cardinality去重算法以及每月销售品牌数量统计

进阶-第56__深入聚合数据分析_fielddata预加载机制以及序号标记预加载

进阶-第55__深入聚合数据分析_fielddata filter的细粒度内存加载控制

进阶-第41__深入聚合数据分析_过滤+聚合：统计价格大于1200的电视平均价格

进阶-第38__深入聚合数据分析_下钻分析之统计每季度每个品牌的销售额

进阶-第36__深入聚合数据分析_实战hitogram按价格区间统计电视销量和销售额

进阶-第49__深入聚合数据分析_percentiles百分比算法以及网站访问时延统计

进阶-第37__深入聚合数据分析_掌握更多metrics：统计每种颜色电视最大最小价格

进阶-第43__深入聚合数据分析_排序：按每种颜色的平均销售额降序排序

Elasticsearch核心技术与实战学习笔记 45 | Bucket & Metric聚合分析及嵌套聚合

ElasticSearch系列七：深入ES聚合数据分析

数据分析必须想清楚的两个概念：指标和维度(转)

ElasticSearch系列四：掌握ES聚合数据分析

回答数据分析的两个基础问题

58、ElasticSearch DSL Bucket、Metric聚合

sas数据分析案例：圆的两个随机和弦相交的概率

python数据分析-判断两个DataFrame的列（Series）是否相同

Elasticsearch聚合分析(二)Bucket聚合分析

数智时代，大数据分析的几个核心概念

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)