zhjx922 De Blog

利用redis实现多属性快速查询

之前有两篇文章介绍了Redis中BitMap的用途和用法,有些小伙伴说这个东西好像没太大的用途,今天我给大家分享一个在实际场景中经常会碰到的情况,那就是多属性筛选

前言

拿京东举例,如下图

筛选

我们要找一款电子琴,牌子有:雅马哈、卡西欧,价格有各种区间,各种颜色、不同的音色数。

现如今动不动就得整点高并发啥的,直接用mysql我们是不是真的扛不住?在前面加一层cache?怎么加?各种属性的组合存到一个属性组合成的key中?如何相对实时的更新属性?

之前的文章我有介绍过redissetbitbitop的使用方法,就是将某一位标记为1或者0代表存在不存在,然后利用bitop进行AND或者OR计算,得到我们想要的结果,今天我们就从零开始打造一个“高性能”的属性筛选器!

按属性储存数据

假设现在我们有三款电子琴,一款雅马哈、两款卡西欧,具体的属性表格为:

ID 品牌 颜色 价格 音色
1 雅马哈 红色 1000 100
2 卡西欧 黑色 2000 150
3 卡西欧 白色 2000 200

我们将属性+属性值组合为key,ID为对应的某位偏移量,这样使用下面的语句初始化数据到redis

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
//初始化品牌
$redis->setBit('brand-雅马哈', 1, 1);
$redis->setBit('brand-卡西欧', 2, 1);
$redis->setBit('brand-卡西欧', 3, 1);
//初始化颜色
$redis->setBit('color-红色', 1, 1);
$redis->setBit('color-黑色', 2, 1);
$redis->setBit('color-白色', 3, 1);
//初始化价格
$redis->setBit('price-1000', 1, 1);
$redis->setBit('price-2000', 2, 1);
$redis->setBit('price-2000', 3, 1);
......

随意组合属性筛选

我想要搜一下,2000元的白色卡西欧,只需要这样

1
2
$redis->bitop('AND', 'cacheKey', 'brand-卡西欧', 'color-白色');
$redis->bitop('AND', 'cacheKey1', 'cacheKey', 'price-2000');

结果cacheKey1的二进制形式为001,这样我们就知道搜索的结果是ID为3的商品。

然而redis并没有提供查询哪些位位1的方法,我们只能通过get方法将内容获取出来,自己处理。提供一段参考代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
$bit = $redis->get($cacheKey);
$bitLength = strlen($bit);
//redis返回的数据长度可能不是8的倍数,为了方便解包,我们将它补齐
while($bitLength % 8 != 0) {
$bitLength++;
}
$bit = str_pad($bit, $bitLength, pack('N', 0));
$bit = unpack('N*', $bit);
$bit = array_filter($bit);
$ids = [];
foreach($bit as $k => $b) {
$bitPos = [];
while($b) {
$bin = sprintf('%032s', decbin($b));
$bitPos[] = strrpos($bin, '1');
$b &= ($b - 1);
}
foreach($bitPos as $pos) {
$ids[] = ($k - 1) * 32 + $pos;
}
}

我在本地试了一下,20W的数据(单个属性-属性值redis占用大概24k),同时搜索4个属性只需要不到10ms,当然现实中肯定没这么理想,但效果一定不会太差。

优化setbit

如果商品和属性过多,对redis的写入压力是相当大的(商品数属性数属性值数的写入数),我们可以先自行组合成字符串,然后单个属性-属性值对写入,具体实现细节就不写了,就是利用pack函数打包。

zhjx922 wechat
欢迎关注二维码,一起交流学习!