从Oracle导出数据并导入到Hive - 代码天地

从Oracle导出数据并导入到Hive

其他 2019-02-22 14:08:09 阅读次数: 0

1、配置源和目标的数据连接

源（oracle）：

目标（Hive 2.1.1)，需要事先将hive的驱动程序导入HHDI的lib目录中。

Hive2.1.1需要的jar包如下：可根据自身情况更换hadoop和hive的jar包。

hadoop-common-2.6.0.jar

hive-common-2.1.0.jar

hive-jdbc-2.1.0.jar

hive-metastore-2.1.0.jar

hive-serde-2.1.0.jar

hive-service-2.1.0.jar

hive-service-rpc-2.1.0.jar

hive-shims-2.1.0.jar

jar包可通过这里查找下载：https://mvnrepository.com/artifact/org.apache.hive/hive-jdbc/2.1.1

2、创建一个导出文本任务，将Oracle的表数据导出到一个文本文件中

配置源表查询语句来抽取源表中的数据，可以增加Where条件缩小抽取的范围。

数据被导出为一个txt文件到HHDI服务所在机器的磁盘中，后缀名为批次号，例如：O_RECORD_BLOODGLUCOSE.20170301

3、将导出的文本文件上传到Hive所在主节点机器的目录中，如果该Hive节点的目录和HHDI服务器的目录做了路径映射，则可以省略这个步骤。

此处选择的是SFTP方式

Hive的主节点为192.168.1.195，SFTP服务已经启用

上传的源文件和目标文件的配置

4、创建一个执行SQL任务，在Hive服务器上执行建表和导入文本数据的命令

采用LOAD DATA命令将本地文件导入Hive

5、创建一个作业流程，将上面创建的几个转换任务编入流程，注意顺序

6、手工执行该作业流程，将oracle的数据导出并导入hive。

除此之外还可以通过CDATA的Hive驱动来从数据库直接导入数据到Hive，详情可查看另外一篇文章：

https://www.cnblogs.com/haohedi/p/9802674.html

HHDI（www.haohedi.com）让ETL变得简单！

猜你喜欢

转载自www.cnblogs.com/haohedi/p/10417902.html

从Oracle导出数据并导入到Hive

hive的rcfile表数据导入到oracle

Mysql数据导入导出,Oracle数据导入导出及Mysql数据导入到Oracle中[回钦波]

oracle 11g导出的dmp数据导入到oracle10g

oracle11g导出数据导入到oracle10g

oracle 11g导出的dmp数据导入到oracle10g <转>

Hive数据导入到Oracle数据库的操作方法

Oracle数据导入到Hive数据库的操作方法

sqoop从oracle数据库抽取数据,导入到hive

Excel数据导入到Oracle表

数据迁移：务数据导出，导入到当前环境

定时将数据导入到hive中

用sqoop将mysql的数据导入到hive表

利用udf函数将hive数据导入到mysql

sqoop将mysql的数据导入到hive表中

使用Mongo dump 将数据导入到hive

使用spark将hive中的数据导入到mongodb

将CSV文件导入到hive数据库

hive ,从hdfs把数据文件导入到表

hive把本地的数据文件导入到表

java 实现 Hive 数据导入到 mysql

使用sqoop将mysql数据导入到hive中

sqoop 数据从hive导入到mysql 遇到的坑

mysql 数据库导出导入到本地文件

dmp数据导入到Oracle数据库中

Oracle11gR2导出数据并导入到10g IMP-00010；ORA-39142

PL/SQL实现CSV数据导入到ORACLE

Excel数据通过plsql 导入到Oracle(转)

SQL Server数据导入到Oracle中的方法

将oracle的数据导入到mysql的几种方法

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)