Hive-数据仓库

  • 交互方式-用户接口:CLI(linux命令行)、WUI(hive web页面)、Client(连接远程服务HiveServer2,eg:JDBC、ODBC)

Hive命令行模式:

1、进入bin 执行./hiv

2、配置Hive环境变量,直接执行命令:hive --service cli 或 hive

Hive的web模式:

执行hive -service hwi 启动后访问http://master:9999/hwi

Hive的远程服务:

默认端口:10000,执行启动命令:nobup hive --service hiveserver2 &

  • 元数据存储:hive是将元数据存储在mysql或者Derby等,元数据主要依赖MetastoreDB服务

hive数据模型包括表、外部表、分区、桶

  • 解析器、编译器、优化器:完成HQL语法解析,由MapReduce执行
  • 数据存储:存储在HDFS中
  • HiveQL:用于分析处理存储在HDFS中的结构化数据,它不支持事务及更新操作,延迟比较大

数据库操作:创建内表、创建外表(external关键字,删除表只删除了元数据信息,不删数据)、 创建静态分区表、创建动态分区表、创建带有数据的表 (create table xx as select xx from table)

数据导入:本地与HDFS导入、单表插入、多表插入

数据导出:导出数据到本地及HDFS

HiveQL查询:兼容大部分sql语法,不支持更新和事务

猜你喜欢

转载自blog.csdn.net/chechelove886/article/details/84308191