TPC-H on Hive

TPC-H是数据库/数据仓库选型决策用的benchmark。它是世界公认的benchmark,由一套面向业务的数据查询和并发数据更新组成。百度文库里有个文档写的还不错。

Jia, Yuntao在HIVE-600中提交了TPC-H的hive driver。Driver由shell脚本作为bootstrap,由一系列HQL文件组成,总共22个benchmark。Driver中并不包含原始数据,需要使用TPC-H的DBGEN生成。

猜你喜欢

转载自joshuasabrina.iteye.com/blog/1885273