简单介绍布隆过滤器

其他 2018-05-06 22:56:14 阅读次数: 3

一句话介绍

布隆过滤器（Bloom Filter）是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。
From 百度百科

输入与输出

S：目标查找元素
Z：被查找元素集(set)
Input: S,Z
Output:
True, S存在于Z
False, S不存在于Z

实际例子

但从文字上是很难理解的，下面举个实际的例子：

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

1. 首先初始化一个size为20、初始值全为0的数组，和两个hash函数(hash函数的个数由自己定，为讲解方便这里使用两个)：

hashA(x) 和 hashB(x)
函数自己定义就好，只要output能对应到数组的key就行。

另外还有一个被查找元素集：

{'wo','shi','sevens','chan'}

2. 把被查找元素集的每个元素都经过所有的hash函数：

'wo' -> hashA('wo') -> 3
'wo' -> hashB('wo') -> 8

扫描二维码关注公众号，回复： 128919 查看本文章

把得到的hash值找到数组的key，然后将值改为1：

0

0

0

1

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

同理把所有元素都处理一遍最后得到数组:

0

1

1

1

0

0

1

0

1

0

0

0

1

0

1

1

0

0

0

0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

3. 然后就开始查找我们的目标元素(假设我们要查找'sevens')是否在集合中，同理，先把目标元素进行一遍hash取值：

'sevens' -> hashA('sevens') -> 6
'sevens' -> hashB('sevens') -> 15

根据两个hash值可以看到，数组中6和15的位置都为1，所以元素可能存在集合中。反之如果有一个为0，都肯定不存在集合中。

可能存在

是的，布隆过滤器是存在一定的误差率的，特别是数据量大的时候，所以我们只能说元素可能存在集合中。在允许误差的场景下还是可以使用的。

猜你喜欢

转载自my.oschina.net/u/203607/blog/1649101

简单介绍布隆过滤器

布隆过滤器的介绍

布隆过滤器介绍

简单实用的布隆过滤器

布隆过滤器

布隆过滤器　

布隆过滤器和Hyperloglog基数统计的介绍

Hbase 布隆过滤器BloomFilter介绍

位图与布隆过滤器简明介绍

布隆过滤器的介绍和实现

布隆过滤器（Bloom Filter）的简单实现

bitmap和布隆过滤器简单总结

【C++】位图的简单实现与布隆过滤器

布隆过滤器(Bloom Filter)

布隆过滤器:Bloom Filter

bitmap 和布隆过滤器

BitMap 、布隆过滤器

转发java 布隆过滤器

哈希变形----布隆过滤器

BloomFilter(布隆过滤器)

布隆过滤器过程详解

python bloomfilter 布隆过滤器

位图与布隆过滤器

布隆过滤器（Java实现）

hbase之布隆过滤器

认识布隆过滤器

位图和布隆过滤器

布隆过滤器（Bloom Filter）

Bloom Filter布隆过滤器

布隆过滤器的简易实现

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)