Scan

在Redis线上维护中，有时候需要从Redis实例成千上万的key中找出特定前缀的key列表来手动处理数据，有可能是修改值，也有可能是删除key，那么如何从海量key中找出满足特定前缀的key列表来？

Redis提供了一个暴力指令keys来列出所有满足正则规则的key。

但这个指令有两个明显缺陷。

Redis为了解决这两个问题，在2.8版本中加入scan指令，相比keys具备以下特点：

基础使用

scan 0 match key99* count 1000，三个参数，cursor整数值（这里是0），正则模式（match key99*），遍历的limit hint（count 1000）。

第一次遍历是cursor是0，然后返回结果中的第一个整数值作为下一次遍历的cursor，直到遍历返回的cursor值为0时结束。

虽然提供的limit是1000，但返回的结果却没几个，这是因为指定的1000代表hashmap中的数组索引，遍历到索引上有链表时会匹配所有数据然后返回，但更多的是很多索引上没有数据，因而会出现返回空数据，但只要cursor不为0就表示遍历没有结束。

不是从0到末尾，而是高位进位加法遍历，使用这种特殊方法是考虑到字典扩容和缩容时避免槽位遍历重复和遗漏。

Java的HashMap扩容的直接扩容，一次性将旧数组下的元素全部转移到新数组中。这个过程叫rehash。

如果HashMap中的元素特别多，线程会出现卡顿现象，Redis为解决这个问题，采用渐进式rehash。

同时保留新旧数组，在定时任务中以及后续hash指令操作中渐渐将旧数组中的元素迁移到新数组上，其同时扫描新旧数组，将结果融合后返回。

在集群环境中，如果某个key太大会导致迁移卡顿，在它需要扩容时会申请更大的内存，也会导致卡顿，如果删除，内存也会一次性回收，还是会导致卡顿。

如果观察到Redis内存大起大落，则极有可能是因为大key导致的。

使用scan指令对每一个key使用type指令获得key的类型，然后应用相应数据结构的size或len方法得到其大小，保留前N名作为结果展示出来。

上述过程需要用脚本实现，比较繁琐。Redis官方在redis-cli中提供了这样的扫描功能。

redis-cli -h 127.0.0.1 -p 6379 --bigkeys

如果担心该命令大幅抬升Redis的ops导致线上报警，增加一个休眠参数。

redis-cli -h 127.0.0.1 -p 6379 --bigkeys -i 0.1

每隔100条指令就会休眠0.1秒，ops就不会剧烈抬升，但扫描时间会变长。