通过JDBC访问hive集群 - 代码天地

通过JDBC访问hive集群

其他 2019-02-02 15:01:05 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u010287342/article/details/53303180

hive是大数据结构化的查询工具，之前一直使用cli客户端连接hive集群进行SQL存储过程代码的测试。
总体上来看，其实Java通过JDBC访问hive跟使用JDBC访问MySQL和Oracle的代码结构基本雷同。区别在于通过JDBC访问hive访问时，查询性能比较慢，千万级别的表测试查询速度，随机查询10条数据，需要10秒，第一次加载需要30秒以上，如果是条件查询则超过5分钟，复杂查询会有查询超时报错。
JDBC方式适合数量在十万以下的表查询，而且不适合复杂的条件查询、关联查询。
JDK版本：1.8
hive版本：0.13
hadoop版本：2.52
集群元数据库MySQL库的版本貌似是5.1，这个其实不影响。
以下为示例代码：

package com.java.linkhive;

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;

import org.apache.hadoop.conf.Configuration;

public class hiveTestCase {
    public static void main(String[] args) throws  Exception {
        Class.forName("org.apache.hive.jdbc.HiveDriver");


       //hive是不支持insert into...values(....)这种操作的

        String querySQLTest = "select order_no from order_bill limit 10";
        //建立连接对象
        Connection con = DriverManager.getConnection("jdbc:hive2://192.XXX.XXX.XXX:10000/DB_AA", "ETL_AA", "ETLABC");
        Statement stmt = con.createStatement();

        stmt.executeQuery(querySQLTest);
        // 执行查询语句
        ResultSet res = stmt.executeQuery(querySQLTest); 

        //输出查询结果 
        int i=1;
          while (res.next()) {
            System.out.println(res.getString(1));
        }
    }
}

以下为输出结果（log4j是java的一个标准日志输出包）：

这里写图片描述
其实代码上并没有什么难度，主要问题出在jar加载上，由于jar包的缺失导致了代码无法执行，下面是经过N次尝试后，得出的编写Java通过JDBC方式连接hive集群时所需要的Jar包：

猜你喜欢

转载自blog.csdn.net/u010287342/article/details/53303180

通过JDBC访问hive集群

Hive_ JDBC访问

在spark集群中通过hive访问mysql数据库

通过JDBC访问phoenix

Java通过JDBC操作Hive

Hive通过JDBC连接HiveServer

Java通过jdbc连接HIVE

SparkSQL——通过JDBC的方式访问

SpringBoot通过JDBC访问数据

scala 通过jdbc访问mysql

SparkSQL（三）jdbc访问hive表

Hive的JDBC访问引发的Maven依赖的实践

Spark采用jdbc的方式访问hive

通过JDBC驱动连接Hive操作实例

java通过jdbc连接hive保姆级

大数据系列之数据仓库Hive知识整理（二）Hive基本操作，使用API通过JDBC连接访问

通过JDBC访问数据库

通过hive访问hbase中的表

hive 使用JDBC访问和启动远程端口

JDBC驱动访问hive中的数据库信息

scala jdbc远程访问hive数据仓库

java 通过jdbc驱动连接hive操作实例

Hive:用Java代码通过JDBC连接Hiveserver

java通过JDBC连接hive数据库

通过Service从外部访问tomcat集群

HIVE JDBC

presto集成kerberos以及访问集成了kerberos的hive集群

SparkSQL远程访问CDH集群Hive数据表

Hive3详细教程（七）Java使用JDBC访问Hive3

04、如何通过spring jdbc访问数据库

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)