HyperLogLog实现uv统计

企业开发 2023-07-29 19:37:16 阅读次数: 0

目录

统计日活、月活案例

特点

1、HyperLogLog是一种算法，并非redis独有。

2、在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比。

3、HyperLogLog 只会根据输入元素来计算基数，而不会储存输入元素本身，所以 HyperLogLog 不能像集合那样，返回输入的各个元素。

4、核心是基数估算算法，最终数值存在一定误差。基数估计的结果是一个带有 0.81% 标准错误（standard error）的近似值。

5、存储时并不会直接占用12k空间，它的存储空间采用稀疏矩阵存储，空间占用很小，仅仅在计数慢慢变大，稀疏矩阵占用空间渐渐超过了阈值时才会一次性转变成稠密矩阵，才会占用 12k 的空间。

在不追求绝对准确的情况下，使用概率算法算是一个不错的解决方案。概率算法不直接存储数据集合本身，通过一定的概率统计方法预估基数值，这种方法可以大大节省内存，同时保证误差控制在一定范围内。

操作

Redis 为 HyperLogLog提供了三个命令：

pfadd添加

pfadd key element [element ...]

pfadd一个已存在的元素时，元素估计数量不发生变化。比如我上边添加过xiaoming，再添加小明时，class:4的key内部存储不发生变化。

pfcount计算

pfcount key [key ...]

当它作用于多个key时，返回所有给定 HyperLogLog 的并集的近似基数，这个近似基数是通过将所有给定 HyperLogLog 合并至一个临时 HyperLogLog 来计算得出的。

pfmerge合并

pfmerge destkey sourcekey [sourcekey ...]

合并后的 HyperLogLog 的基数接近于所有输入 HyperLogLog 的可见集合（observed set）的并集。

然后计算可得

应用场景

统计uv案例

把每天访问的ip放入HyperLogLog结构中

如果统计某天uv，直接使用pfcount 日期即可

如果统计某几天uv，先合并，在计算即可

统计日活、月活案例

略

小结

了解熟悉HyperLogLog，对它有一个基本认知

猜你喜欢

转载自blog.csdn.net/wai_58934/article/details/131833747

HyperLogLog实现uv统计

Redis实战篇：基于HyperLogLog实现UV统计功能

HyperLoglog算法在Uv实时统计中的应用

使用 Redis Hyperloglog，轻松统计 UV 数据

使用Redis统计UV数据-HyperLogLog

使用Redis神奇的HyperLogLog做UV统计

hyperloglog计算uv原理

redis的hyperLoglog的应用-网站的数据统计（Uv数、IP数等）

HyperLogLog基数统计

PHP准确的实现页面访问统计次数uv

Flink 用布隆过滤器来实现UV统计

redis实战-实现用户签到&UV统计

python统计pv/uv

Redis站点流量统计HyperLogLog

Redis HyperLogLog 解决统计问题

Redis实战之HyperLogLog统计

storm高并发UV统计

统计不同商家的pv uv

网站统计IP PV UV

Flink统计当日的UV、PV

MapReduce程序统计UV数量

实战篇--UV统计

Reids(4)——神奇的HyperLoglog解决统计问题

redis源码阅读—hyperloglog(基数统计)

基数统计算法--HyperLogLog

【Sqoop】使用Hive和Sqoop实现网站基本指标PV和UV的统计

hyperloglog

统计不同渠道的的UV，再合计渠道总计UV

NGINX: 统计网站的PV、UV、独立IP

统计--------同比、环比、PV、UV、VV、IP

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)