一种较快速的数据库数据提取方案

简单说:利用数据库自带的功能快速dump部分数据到文件,然后采用内存映射的方式解析文件获得数据。这种比直接访问的效率快21倍左右。

原理就是,cpp代码直接访问数据库的提取速度永远不会有数据库开发者的dump快。开发者的优势在于减少函数调用和内存转换。

sqlserver的dump方法不清楚,没研究出来。
oracle暂时没去研究,项目未涉及。

mysql的有mysqldump.exe、INTO OUTFILE两种。
最终INTO OUTFILE胜出。
例如:

SELECT ID,C FROM `base` where ID >0 and ID <=100000 INTO OUTFILE 'E:/C_100000.txt'

另外,任何一种方法的读取速度都不是线性变化的。dump后读文件,最优效率在一次读取10万条-20万条。
1022万条数据时,查询count的时间45.038s。导出时间47.939ms。一万条以内,直接读取也远远慢于dump后读文件。由此可见,没必要根据count来分为多次读取。

猜你喜欢

转载自blog.csdn.net/weixin_43172531/article/details/106167698