HBase实战 | HBase在B站Saber平台的实践

Saber平台建设之路

标准化指标输出,通用指标模型设计

  • HBase表存储指标明细数据

  • RowKey设计准则:

    • rowkey=指标列+时间列+存储粒度

    • 指标列:提供灵活的拼装规则,主要由指标ID+维度1+维度2...而针对移动端APP埋点上报的流数据质量,则可划分为:指标ID、维度枚举值、流数据ID、客户端版本号。PS:而维度枚举值的取值范围为(长度为2):01.一致性,02.完整性,03.唯一性,04.准确性,05.规范性,06到99.自定义。

    • 时间列:该列采用默认格式,即“YYYYMMDD”

    • 存储粒度:该列采用枚举值,1:天粒度,2:小时粒度,3:分钟粒度。


  • 列族设计

    • 列族根据存储粒度来进行列族的划分,例如针对天粒度的则只有一个列,针对小时粒度则有24列,针对分钟粒度则有1440列。

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片


图片图片

图片

图片

图片

图片

图片

图片

图片

图片

图片



猜你喜欢

转载自blog.51cto.com/15060465/2676945