Hive中元数据表的关系和含义
其他
2018-05-26 06:19:40
阅读次数: 0
Hive版本的元数据表
version表
字段 |
含义 |
VER_ID |
id主键 |
SCHEMA_VERSION |
Hive 版本 |
VERSION_COMMENT |
版本说明 |
Hive数据库相关元数据表
DBS表
字段 |
含义 |
DB_ID |
数据库ID |
DESC |
数据库描述 |
DB_LOCATION_URI |
数据库HDFS路径 |
NAME |
Hive数据库名 |
OWNER_NAME |
Hive数据库所有者用户名 |
OWNER_TYPE |
Hive所有者角色 |
Hive表和视图相关的元数据表
TBLS表
字段 |
含义 |
TBL_ID |
表ID |
CREATE_TIME |
创建时间 |
DB_ID |
数据库ID |
LAST_ACCESS_TIME |
上次访问时间 |
OWNER |
所有者 |
RETENTION |
保留字段 |
SD_ID |
序列化配置信息 |
TBL_NAME |
表名 |
TBL_TYPE |
表类型 |
VIEW_EXPANDED_TEXT |
视图的详细HQL |
VIEW_ORIGINAL_TEXT |
视图的原始HQL |
TTABLE_PARAMS表
字段 |
含义 |
TBL_ID |
表ID |
PARAM_KEY |
表属性名 |
PARAM_VALUE |
表属性值 |
Hive 文件存储信息相关的元数据
SDS表
字段 |
含义 |
SD_ID |
存储信息ID |
CD_ID |
字段信息ID |
INPUT_FORMAT |
文件输入格式 |
IS_COMPRESSED |
是否压缩 |
IS_STOREDASSUBDIRECTORIES |
是否以子目录存储 |
LOCATION |
HDFS路径 |
NUM_BUCKETS |
分桶 |
OUTPUT_FORMAT |
文件输出格式 |
SERDE_ID |
序列化类ID |
SERDES表
字段 |
含义 |
SERDE_ID |
序列化类配置ID |
NAME |
序列化类别名 |
SLIB |
序列化类 |
SERDE_PARAMS 表
字段 |
含义 |
SERDE_ID |
序列化类配置ID |
PARAM_KEY |
属性名 |
PARAM_VALUE |
属性值 |
Hive表字段相关元数据表
COLUMNS_V2表
字段 |
含义 |
CD_ID |
字段信息ID |
COMMENT |
字段注释 |
COLUMN_NAME |
字段名 |
TYPE_NAME |
字段类型 |
INTEGER_IDX |
字段顺序 |
Hive表分区相关元数据表
PARTITIONS 表
字段 |
含义 |
PART_ID |
分区ID |
CREATE_TIME |
分区创建时间 |
LAST_ACCESS_TIME |
最后一次访问时间 |
PART_NAME |
分区名 |
SD_ID |
分区存储ID |
TBL_ID |
表ID |
PARTITION_KEYS 表
字段 |
含义 |
TBL_ID |
表ID |
PKEY_COMMENT |
分区字段名说明 |
PKEY_NAME |
分区字段名 |
PKEY_TYPE |
分区字段类型 |
INTEGER_IDX |
分区字段顺序 |
PARTITION_KEY_VALS 表
字段 |
含义 |
PART_ID |
分区ID |
PART_KEY_VAL |
分区字段值 |
INTEGER_IDX |
分区字段顺序 |
PARTITION_PARAMS 表
字段 |
含义 |
PART_ID |
分区ID |
PARAM_KEY |
分区属性名 |
PARAM_VALUE |
分区属性值 |
各表之间主键的关系图
转载自blog.csdn.net/lemonzhaotao/article/details/80202034