Apache Hive介绍&Hive实现思路模拟

Hive简介

什么是Hive

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射 为一张数据库表,并提供类SQL(Hive SQL 或者 HQL)查询功能。
本质是将SQL转换为MapReduce程序。
主要用途:用来做离线数据分析,比直接用MapReduce开发效率更高。
在这里插入图片描述

为什么使用Hive

直接使用Hadoop MapReduce处理数据所面临的的问题:

  • 人员学习成本太高
  • MapReduce实现复杂查询逻辑开发难度太大

使用Hive:

  • 操作接口采用类SQL语法,提供快速开发的能力
  • 避免了去写MapReduce,减少开发人员的学习成本
  • 功能扩展很方便
发布了64 篇原创文章 · 获赞 2 · 访问量 2773

猜你喜欢

转载自blog.csdn.net/anniewhite/article/details/105311572