一分钟学会系列：Guava布隆过滤器 - 代码天地

一分钟学会系列：Guava布隆过滤器

其他 2019-03-06 20:35:22 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/t1g2q3/article/details/87704249

import com.google.common.hash.BloomFilter;
import com.google.common.hash.Funnels;
import java.nio.charset.Charset;

/**
 * 布隆过滤器
 *
 * bloom算法类似一个hash set，用来判断某个元素（key）是否在某个集合中。
 * 和一般的hash set不同的是，这个算法无需存储key的值，对于每个key，只需要k个比特位，每个存储一个标志，用来判断key是否在集合中。
 *
 *
 * 优点：不需要存储key，节省空间
 * 缺点：
 * 1. 算法判断key在集合中时，有一定的概率key其实不在集合中
 * 2. 无法删除
 *
典型的应用场景：
1.某些存储系统的设计中，会存在空查询缺陷：当查询一个不存在的key时，需要访问慢设备，导致效率低下。比如一个前端页面的缓存系统，可能这样设计：先查询某个页面在本地是否存在，如果存在就直接返回，如果不存在，就从后端获取。但是当频繁从缓存系统查询一个页面时，缓存系统将会频繁请求后端，把压力导入后端。这时只要增加一个bloom算法的服务，后端插入一个key时，在这个服务中设置一次需要查询后端时，先判断key在后端是否存在，这样就能避免后端的压力。
2.如何判断元素在亿级数据中存在
现在有一个非常庞大的数据，假设全是 int 类型。现在我给你一个数，你需要告诉我它是否存在其中(尽量高效)。
 * 
 * @author  tangguoqiang
 */
public class TestBloomFilter {

    public static void main(String[] args) {
        BloomFilter bloomFilter = BloomFilter.create(
                Funnels.stringFunnel(Charset.defaultCharset()),
                1000000,0.001);
        bloomFilter.put("Test");
        bloomFilter.put("Go");
        bloomFilter.put("Java");
        bloomFilter.put("Python");
        bloomFilter.put("C++");
        bloomFilter.put("Array");
        bloomFilter.put("Lambda");
        System.out.println(bloomFilter.mightContain("TangGuoqiang"));
        System.out.println(bloomFilter.mightContain("Java"));
    }
}

猜你喜欢

转载自blog.csdn.net/t1g2q3/article/details/87704249

一分钟学会系列：Guava布隆过滤器

一分钟学会系列：谷歌工具箱Guava

一分钟学会系列：异步交互

一篇30分钟文章带您掌握布隆过滤器(Redisson)

Guava的布隆过滤器

一分钟sed入门（一分钟系列）

一分钟学会如何访问Pornhub

一分钟学会《模板方法模式》

一分钟学会 docker

一分钟学会git

一分钟学会docker安装

一分钟学会Docker

一分钟学会系列：事务超时机制

一分钟学会系列：Jar包启动脚本

一分钟学会系列：Spring MVC与设计模式

一分钟学会系列：设计模式替换IF ELSE代码

一分钟学会系列：图解多租户的实现方案

一分钟学会系列：Web项目接口改造Spring Boot + Dubbo服务

一分钟学会系列：MySQL中的锁

一分钟学会系列：缓存穿透与缓存雪崩

一分钟学会系列：生产环境访问Redis Cluster

一分钟学会系列：Spring的@Primary注解

一分钟学会系列：设计模式落地方案

一分钟学会系列：Redis实现分布式锁

一分钟学会系列：Dubbo直连服务提供者

一分钟学会系列：定时任务实现方案

布隆过滤器原理以及Guava的BloomFilter使用

redis是整合google guava的布隆过滤器

一分钟系列：读懂GC日志

一分钟系列：闭锁与栅栏

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)