海量数据下HBase的读性能 - 代码天地

海量数据下HBase的读性能

企业开发 2018-05-14 09:00:13 阅读次数: 2

这段时间刚做完一个hbase项目，存储千亿规模的数据，12台dell，5小时完成扫库。
这里主要是对hbase的数据本地化机制作了优化，本文不对细节作描述。
在后期使用的过程中，使用方发现hbase的随机读性能出现了较大的下降，经常出现单个 GET请求花费3-5秒的现象。这个事情困扰了我很久，因为从我的实验环境上是不可复现的。

实验环境和线上环境的主要区别是数据量和写压力：
实验环境百亿规模的数据，线上是千亿
实验环境基本上没有写压力，而线上随时有较大的写压力。

关于原因做了很多猜测，但是后来都被实验否定了，比如以为hdfs的性能不够，以为Meta Region的性能问题等等。
经过一段时间的跟踪，终于发现问题出现在Bloom Filter上，hbase的bloom filter是惰性加载的，在写压力比较大的情况下，会有不停的compact并产生storefile，那么新的storefile是不会马上将bloom filter加载到内存的，等到读请求来的时候才加载。
这样问题就来了，第一，我们的storefile设置的比较大，max size为2G，这会导致bloom filter也比较大；第二，系统的读写压力都比较大。两个因素加起来，就导致了前边所说的问题。

解决办法：
1)去掉 bloomfilter，我们的数据太大了，这个东西的好处看起来还不如不加好，瞬间就能搞定。
2)将bloomfilter改成激进的方式加载，这个要安排下，恩。

猜你喜欢

转载自redisliu.iteye.com/blog/1139932

海量数据下HBase的读性能

hbase读的性能优化

Hbase(1)-MySQL海量数据存储的启发

HBase最佳实践－读性能优化策略

HBase最佳实践——读性能优化策略

SQL海量数据读写性能优化

海量数据展示(二）-性能优化

性能测试之如何构造海量数据

【原创】HBase如何实现海量数据的毫秒级查询

基于HBase的海量微博数据高效存储解析

Elasticsearch+Hbase实现海量数据秒回查询

hbase通过BulkLoad的方式快速导入海量数据

使用spark bulkload加载海量数据到hbase

通过Bulkload将海量数据导入到HBase的方法

基于HBase的海量数据实时查询系统设计与实现

HBase ：利用SQL BulkLoad快速导入海量数据

【教程】Hbase+ElasticSearch构建海量数据检索平台

HBase海量数据高效入仓解决方案

MR读Hbase数据，写入到Mysql(HBase->Mysql)

HBase性能优化方法总结（三）：读表操作

干货：HBase实践之读性能优化策略

深入探讨hbase读性能优化探讨（20190308）

巧用ChatGPT 解决 Hbase 快照方式读性能优化问题

HyperLogLog：海量数据下的基数计算

【数据篇】31 # 如何对海量数据进行优化性能？

Hbase教程：通过BulkLoad快速将海量数据导入到Hbase

海量数据存储 - 性能瓶颈 - 解决方案

mysql 优化海量数据插入和查询性能

Trie树-提高海量数据的模糊查询性能

数据库设计 - 读性能提升

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)