布隆过滤器应用——解决Redis缓存穿透问题
nanshan 2024-12-12 14:06 13 浏览 0 评论
1. 布隆过滤器
- 简要介绍布隆过滤器的概念和特点,详细知识请参考几篇参考文献或其它文章。
1.1 概念
简单点说,布隆过滤器本质是一个位数组。
- 当一个元素加入过滤器时,使用多个hash函数对元素求值,并将位数组中对应位置为1;
- 判断一个元素是否在过滤器中时,使用多个函数对元素求值,并判断位数组对应位置是否为1。如果都为1,认为元素在过滤器中;否则认为元素不在过滤器中。
1.2 特点
- 布隆过滤器判断元素存在,可能存在误判;但判断元素不存在,必然不存在。
- 布隆过滤器通过多个hash函数来降低冲突,增加hash函数数目可以降低冲突率。
- 当过滤器中元素达到一定数目时,增加hash函数不能有效降低冲突率。
- 使用位数组,占用数据空间小。
- 删除元素困难。
2
3. 布隆过滤器解决缓存穿透问题
3.1 为什么使用布隆过滤器来解决缓存穿透问题
(1)布隆过滤器与redis set结果对比
为什么不将所有value都存储在redis的set中,在请求数据库之前先访问查询value是否存在?主要有以下几点原因:
- 缓存穿透问题是因为查询了一个数据库中没有的值,需要能够在请求数据库之前判断数据库中是否存在该值。
- 由于redis用来作缓存,本身不可能存储所有的数据(因为内存是昂贵的,就算有32G内存,和T级的存储相比也显得渺小),只能用来存储热点数据。但是又需要有一个速度很快的内存结构来存储所有值,显然没法使用常规的map和set(空间开销巨大)
- 布隆过滤器使用位数组,占用空间极小。
- 布隆过滤器以较低的误判率换取了大量的空间。(存在较低的假阳性,会使得向数据库请求极少的不存在的值,带来较少的时间开销)
布隆过滤器与set空间消耗对比:
(2)布隆过滤器与md5等单向映射算法对比
在value占用空间较大大时(比如网址),还可以将所有的value通过算法单向映射成一个值(比如使用md5),这样只存储映射后的值,而不需要存储value,从而达到节约空间的目的。
布隆过滤器与单向映射后取值空间消耗对比
假设仍有100亿条URL,那么大概需要一个34位(4.25b)的value来表示才能保证较低的冲突率,仍需要大约42.5GB的空间大小,对应布隆过滤器方案如(1)所示只需要25GB
2^34=171 7986 9184
(3)几种方案对比可参考:
3.2 如何使用布隆过滤器解决缓存穿透问题
3.2.1 基本步骤
应用布隆过滤器解决Redis缓存穿透问题主要有以下步骤:
- (1)在添加数据库记录时,向过滤器中增加元素。
- (2)收到请求时,先查询redis缓存,缓存中没有查询布隆过滤器;布隆过滤器中没有直接返回,有查询数据库;
- (3)暂时还不清楚需不需要对过滤器中元素进行删除,以及如何删除,是否可以考虑定时对过滤器进行清空动作?还是需要使用CountBloomFilter结构来实现删除?
3.2.2 请求流程
增加了布隆过滤器的Redis作缓存系统的一次请求过程如下:
4. Redis布隆过滤器实现
4.1.1 借助Redis原生位图实现布隆过滤器
借助位图的话,需要自行实现多个hash函数,以及布隆过滤器的其它特性,可参考:用Redis快速实现BloomFilter
4.1.2 使用Redisson封装的RBloomFilter
redisson封装实体类RBloomFilter,分析源码同样是使用位图实现的,相关细节可分析源码。
RBloomFilter使用代码示例:
public void test1() {
String filterName = "filterA";
RBloomFilter<String> bloomFilter = redissonService.redissonClient().getBloomFilter(filterName);
bloomFilter.tryInit(1000000L, 0.01);
bloomFilter.add("value1");
boolean value1Exists = bloomFilter.contains("value1");
boolean value2Exists = bloomFilter.contains("value2");
System.out.println("1. Redisson value1 exists: " + value1Exists);
System.out.println("1. Redisson value2 exists: " + value2Exists);
}
执行结果:
1. Redisson value1 exists: true
1. Redisson value2 exists: false
4.2. RedisBloom模块
Redis 在 4.0 的版本中加入了 module 功能,布隆过滤器可以通过 module 的形式添加到 redis 中,所以使用 redis 4.0 以上的版本可以通过加载 module 来使用 redis 中的布隆过滤器。还可以使用 docker 可以直接在 redis 中布隆过滤器。
4.2.1 Redis集成布隆过滤器模块
参考网址:
https://oss.redislabs.com/redisbloom/Quick_Start/
(1)安装RedisBloom模块
git clone https://github.com/RedisBloom/RedisBloom.git
cd RedisBloom
make
(2)启动redis-server
修改相应的server、conf、redisbloom.so的路径
./redis-server ./redis.conf --loadmodule ./redisbloom.so
4.2.2 主要命令
命令含义BF.ADD filterName value在过滤器中增加某个valueBF.MADD filterName value1 value2增加多个valueBF.EXISTS filterName value判断过滤器中是否存在某个valueBF.MEXISTS filterName value1 value2判断多个value是否存在BF.RESERVE <error_rate>显式创建过滤器
BF.RESERVE
- error_rate:允许布隆过滤器的错误率,这个值越低过滤器的位数组的大小越大,占用空间也就越大。
- initial_size:布隆过滤器预计储存的元素个数,当实际存储的元素个数超过这个值之后,过滤器的准确率会下降。
错误率越小,需要的空间越大;预计元素个数越大,需要的空间越大。
示例:
bf.reserve urls 0.01 100
4.2.3 Java使用RedisBloom
在Java中如何使用RedisBloom模块呢?
考虑可以通过lua脚本(或其它可以执行原生Redis命令的方式)执行BF.ADD和BF.EXISTS等命令,RedisBloom官方中还推荐了JReBloom库。
(1)lua脚本执行原生命令
代码示例如下:
public void test2() {
String filterName = "filterB";
String addValueScript = "return redis.call('BF.ADD', KEYS[1], ARGV[1]); ";
redisService.executeLuaScript(addValueScript,
RScript.ReturnType.BOOLEAN,
Lists.newArrayList(filterName),
Lists.newArrayList("value1"));
String valueExistsScript = "return redis.call('BF.EXISTS', KEYS[1], ARGV[1]); ";
Boolean value1Exists = redisService.executeLuaScript(valueExistsScript,
RScript.ReturnType.BOOLEAN,
Lists.newArrayList(filterName),
Lists.newArrayList("value1"));
Boolean value2Exists = redisService.executeLuaScript(valueExistsScript,
RScript.ReturnType.BOOLEAN,
Lists.newArrayList(filterName),
Lists.newArrayList("value2"));
System.out.println("2. LuaScript value1 exists: " + value1Exists);
System.out.println("2. LuaScript value2 exists: " + value2Exists);
}
复制代码
执行结果:
2. LuaScript value1 exists: true
2. LuaScript value2 exists: false
(2)JRedisBloom
引入jar包和仓库:
<dependency>
<groupId>com.redislabs</groupId>
<artifactId>jrebloom</artifactId>
<version>2.0.0-SNAPSHOT</version>
</dependency>
<repository>
<id>snapshots-repo</id>
<url>https://oss.sonatype.org/content/repositories/snapshots</url>
</repository>
代码示例:
public void test3() {
String filterName = "filterC";
Client client = new Client("localhost", 7379);
client.add(filterName, "value1");
boolean value1Exists = client.exists(filterName, "value1"); // true
boolean value2Exists = client.exists(filterName, "value2"); // False
System.out.println("3. JRedisBloom value1 exists: " + value1Exists);
System.out.println("3. JRedisBloom value2 exists: " + value2Exists);
}
执行结果:
3. JRedisBloom value1 exists: true
3. JRedisBloom value2 exists: false
5. 总结
布隆过滤器应用诸多,可用来过滤垃圾邮箱、海量URL识别等。用其来解决Redis缓存穿透问题,也只是缓存穿透问题的一种解决方案。
相关推荐
- Let’s Encrypt免费搭建HTTPS网站
-
HTTPS(全称:HyperTextTransferProtocoloverSecureSocketLayer),是以安全为目标的HTTP通道,简单讲是HTTP的安全版。即HTTP下加入...
- 使用Nginx配置TCP负载均衡(nginx tcp负载)
-
假设Kubernetes集群已经配置好,我们将基于CentOS为Nginx创建一个虚拟机。以下是实验种设置的详细信息:Nginx(CenOS8Minimal)-192.168.1.50Kube...
- Nginx负载均衡及支持HTTPS与申请免费SSL证书
-
背景有两台minio文件服务器已做好集群配置,一台是192.168.56.41:9000;另一台是192.168.56.42:9000。应用程序通过Nginx负载均衡调用这两台minio服务,减轻单点...
- HTTPS配置实战(https配置文件)
-
原因现在网站使用HTTPS是规范操作之一,前些日子买了腾讯云服务,同时申请了域名http://www.asap2me.top/,目前该域名只支持HTTP,想升级为HTTPS。关于HTTPS的链接过程大...
- 只有IP地址没有域名实现HTTPS访问方法
-
一般来说,要实现HTTPS,得有个注册好的域名才行。但有时候呢,咱只有服务器的IP地址,没注册域名,这种特殊情况下,也能照样实现HTTPS安全访问,按下面这些步骤来就行:第一步,先确认公网...
- 超详解:HTTPS及配置Django+HTTPS开发环境
-
众所周知HTTP协议是以TCP协议为基石诞生的一个用于传输Web内容的一个网络协议,在“网络分层模型”中属于“应用层协议”的一种。在这里我们并不研究该协议标准本身,而是从安全角度去探究使用该协议传输数...
- Godaddy购买SSL之后Nginx配置流程以及各种错误的解决
-
完整流程:参考地址:https://sg.godaddy.com/zh/help/nginx-generate-csrs-certificate-signing-requests-3601生成NGI...
- Nginx从安装到高可用,一篇搞定(nginx安装与配置详解)
-
一、Nginx安装1、去官网http://nginx.org/下载对应的nginx包,推荐使用稳定版本2、上传nginx到linux系统3、安装依赖环境(1)安装gcc环境yuminstallgc...
- 阿里云免费证书申请,配置安装,使用tomcat,支持http/https访问
-
参数说明商品类型默认已选择云盾证书服务(无需修改)。云盾证书服务类型SSL证书服务的类型。默认已选择云盾SSL证书(无需修改),表示付费版SSL证书。如果您需要免费领取或付费扩容DV单域名证书【免费试...
- 你试过两步实现Nginx的规范配置吗?极速生成Nginx配置小工具
-
NGINX是一款轻量级的Web服务器,最强大的功能之一是能够有效地提供HTML和媒体文件等静态内容。NGINX使用异步事件驱动模型,在负载下提供可预测的性能。是当下最受欢迎的高性能的Web...
- 从零开始搭建HTTPS服务(搭建https网站)
-
搭建HTTPS服务的最初目的是为了开发微信小程序,因为wx.request只允许发起HTTPS请求,并且还必须和指定的域名进行网络通信。要从零开始搭建一个HTTPS的服务需要下面4...
- 群晖NAS使用官网域名和自己的域名配置SSL实现HTTPS访问
-
安全第一步,群晖NAS使用官网域名和自己的域名配置SSL实现HTTPS访问【新手导向】NAS本质还是一个可以随时随地访问的个人数据存储中心,我们在外网访问的时候,特别是在公网IP下,其实会面临着很多安...
- 让网站快速升级HTTPS协议提高安全性
-
为什么用HTTPS网络安全越来越受到重视,很多互联网服务网站,都已经升级改造为https协议。https协议下数据包是ssl/tcl加密的,而http包是明文传输。如果请求一旦被拦截,数据就会泄露产生...
- 用Https方式访问Harbor-1.9版本(https访问流程)
-
我上周在头条号写过一篇原创文章《Docker-Harbor&Docker-kitematic史上最详细双系统配置手册》,这篇算是它的姊妹篇吧。这篇文章也将用到我在头条写的另一篇原创文章的...
- 如何启用 HTTPS 并配置免费的 SSL 证书
-
在Linux服务器上启用HTTPS并配置免费的SSL证书(以Let'sEncrypt为例)可以通过以下步骤完成:---###**一、准备工作**1.**确保域名已解析**...
你 发表评论:
欢迎- 一周热门
-
-
极空间如何无损移机,新Z4 Pro又有哪些升级?极空间Z4 Pro深度体验
-
如何在安装前及安装后修改黑群晖的Mac地址和Sn系列号
-
爱折腾的特斯拉车主必看!手把手教你TESLAMATE的备份和恢复
-
10个免费文件中转服务站,分享文件简单方便,你知道几个?
-
[常用工具] OpenCV_contrib库在windows下编译使用指南
-
日本海上自卫队的军衔制度(日本海上自卫队的军衔制度是什么)
-
【系统配置】信创终端挂载NAS共享全攻略:一步到位!
-
UOS服务器操作系统防火墙设置(uos20关闭防火墙)
-
Ubuntu系统Daphne + Nginx + supervisor部署Django项目
-
WindowsServer2022|配置NTP服务器的命令
-
- 最近发表
- 标签列表
-
- linux 查询端口号 (58)
- docker映射容器目录到宿主机 (66)
- 杀端口 (60)
- yum更换阿里源 (62)
- internet explorer 增强的安全配置已启用 (65)
- linux自动挂载 (56)
- 禁用selinux (55)
- sysv-rc-conf (69)
- ubuntu防火墙状态查看 (64)
- windows server 2022激活密钥 (56)
- 无法与服务器建立安全连接是什么意思 (74)
- 443/80端口被占用怎么解决 (56)
- ping无法访问目标主机怎么解决 (58)
- fdatasync (59)
- 405 not allowed (56)
- 免备案虚拟主机zxhost (55)
- linux根据pid查看进程 (60)
- dhcp工具 (62)
- mysql 1045 (57)
- 宝塔远程工具 (56)
- ssh服务器拒绝了密码 请再试一次 (56)
- ubuntu卸载docker (56)
- linux查看nginx状态 (63)
- tomcat 乱码 (76)
- 2008r2激活序列号 (65)