Redis测试分析(pipeline模式推荐)

测试环境
Redis测试版本：2.2.12
使用Java Jedis客户端进行测试
测试数据量：50万，超过2亿

速度
1) mset函数插入效率最高，插入Redis的速度达到20万条数据/秒。但是该函数所耗内存较高，对于我们实际应用一表每天2.4亿的数据量来说，需要消耗近32G内存；
2) mset函数中当m值达到200以上时，插入速度接近饱和，因此实际应用中，应设定该值 >= 200，以达到最高的插入效率；
3) set函数除非特定应用场景需求，否则应尽量不要使用，其插入效率为mset函数的1/20；
4) 尽管不同的函数都有string与byte[]两种不同的形式，但是对于Redis来说byte[]的形式也是将每个byte看成是一个字符来进行处理的。在实际应用中，对于较长的整型数据(例如：9824224123)，可以将其转换为byte[]的形式，4个byte[]可以存储一个int数据，这样会比采用string的形式存储节省一部分的内存开销；
5) hset函数插入效率与set函数相当；
6) hmset由于在实际应用中，每条数据对应的key不相同，需要维护一个本机的缓存容器Map<key,Map<field, value>>，因此插入速度要比mset函数慢一些；

内存
1) hset和 hmset函数大约可以比set和mset函数节省三分之一的内存；
2) hset和hmset函数对于每个key所存储的<field, value>数目非常敏感。一旦超过限制，插入效率下降十分明显，同样，内存开销也会显著增加。在实际应用中，应尽量保证每个key下面的<field, value>的数目不超过限制(默认值为64)。

Pipeline
redis的pipeline(管道)功能在命令行中没有，但redis是支持pipeline的，而且在各个语言版的client中都有相应的实现。
Redis本身是一个cs模式的tcp server, client可以通过一个socket连续发起多个请求命令。每个请求命令发出后client通常会阻塞并等待redis服务端处理，redis服务端处理完后将结果返回给client。

Client: hset a1 field value
Server: 1
Client: hset a2 field value
Server: 1
Client: hset a3 field value
Server: 1
Client: hset a4 field value
Server: 1

这种发送模式中由于网络开销延迟，即算redis server端有很强的处理能力，也由于收到的client消息少，而造成吞吐量小。我们可以修改一种处理模式，

Client: hset a1 field value
Client: hset a2 field value
Client: hset a3 field value
Client: hset a4 field value
Server: 1
Server: 1
Server: 1
Server: 1

通过pipeline方式将client端命令一起发出，redis server会处理完多条命令后，将结果一起打包返回client,从而节省大量的网络延迟开销。
下面以Java的客户端jedis来测试pipeline的效果。

Pipeline pipeline = jedis.pipelined();
long start = System.currentTimeMillis();
for (int i = 0; i < 10000; i++) {
    pipeline.hset("server", "" + i, "" + i);
}
List<Object> results = pipeline.execute();
long end = System.currentTimeMillis();
System.out.println("Pipelined SET: " + ((end - start)/1000.0) + " seconds");

测试的结果采用pipeline方式，效率几乎与mset一样，每秒插入约15万数据，但内存占用仅为mset的1/3.

Redis测试分析(pipeline模式推荐)

猜你喜欢