HyperLogLog（关于基数统计）

Redis

发布日期: 2023-06-20

更新日期: 2025-06-11

文章字数: 518

阅读次数:

写在前面

今天在复习Redis的一种在Redis 2.8.9 版本更新的结构的时候，知道了这个数据结构是基于一种优秀的算法HyperLogLog，基数统计算法（简单来说就是统计集合中的元素数量，但是对比set有了很大的优化），就去了解了一下这种算法的精妙之处。

HyperLogLog

这种数据结构在Redis这种NoSQL型数据库中可以非常省内存的去统计各种计数，比如注册 IP 数、每日访问 IP 数、页面实时UV、在线用户数，共同好友数等。这个是应用场景。

127.0.0.1:6379[1]> PFADD k1 a b c d 1 2 3 4 1 2 3 4 5
(integer) 1
127.0.0.1:6379[1]> PFCOUNT k1
(integer) 9
127.0.0.1:6379[1]> PFADD k2 a b c d 1 2 3 
(integer) 1
127.0.0.1:6379[1]> PFMERGE k1 k2
OK
127.0.0.1:6379[1]> PFCOUNT k1
(integer) 9
127.0.0.1:6379[1]> PFADD k2 a b c 5 6 1 2 3 4
(integer) 1
127.0.0.1:6379[1]> PFCOUNT k2
(integer) 10
127.0.0.1:6379[1]> keys *
1) "k2"
2) "k1"
127.0.0.1:6379[1]> PFCOUNT k2
(integer) 10
127.0.0.1:6379[1]> PFCOUNT k1
(integer) 9
127.0.0.1:6379[1]> PFMERGE k1 k2 
OK
127.0.0.1:6379[1]> PFCOUNT k1
(integer) 10