sqoop从mysql到hive实现定时增量导入 - 代码天地

sqoop从mysql到hive实现定时增量导入

其他 2018-09-14 08:19:32 阅读次数: 0

1、第一次全量抽取，并创建hive表

#keberos认证

kinit -kt hdfs.keytab hdfs

#从oracle导数据到hive

sqoop import --connectjdbc:oracle:thin:@xx.xx.xx.xx:1521:xx\

--username xxx--password xxx\

--table PROD_FDC.EQUIPMENT\

--target-dir=/user/hive/warehouse/fdc_test.db/equipment\

--hive-import --hive-database xx--hive-table xx\

--create-hive-table

在使用时，只需要替换源数据库IP，用户名和密码，以及hive目标表的目录，数据库和表名

2、创建增量抽取的job

sqoop job --create fdc_equipment_job \

-- import --connect jdbc:oracle:thin:@xx.xx.xx.xx:1521:xx \

--username xxx--password xxx\

--table PROD_FDC.EQUIPMENT \

--target-dir=/user/hive/warehouse/fdc_test.db/equipment \

--hive-import --hive-database fdc_test --hive-table equipment \

--incremental append \

--check-column equipmentid --last-value 1893

说明：增量抽取，需要指定--incremental append，同时指定按照源表中哪个pk字段进行增量--check-column equipmentid，并指定hive表中pk当前最大值--last-value 1893。创建sqoop job的目的是，每次执行job以后，sqoop会自动记录pk的last-value，下次再执行时，就会自动指定last-value，不需要手工去改了。

3、执行sqoop job

sqoop job --exec fdc_equipment_job

如果创建的job有问题，可以删除再重新创建：

sqoop job --delete fdc_equipment_job

4、定时执行sqoop job

首先创建一个.sh的程序，然后通过crontab –e，创建定时执行程序

crontab -e

30 0 * * 1 /home/root/fdc/equipment_sqoop.sh >> /home/root/fdc/equipment.log 2>&1

猜你喜欢

转载自blog.csdn.net/xiaolong_4_2/article/details/82111158

sqoop从mysql到hive实现定时增量导入

sqoop 导入增量数据到hive

sqoop增量导入oracle/mysql数据到hive时时间字段为null处理

Sqoop从Mysql全量定时导入Hive

使用sqoop从mysql导入数据到hive

# Sqoop从Mysql导入数据到Hive

sqoop从mysql导入数据到hive

3.2.3 Sqoop 数据迁移工具, 导入数据import, MySQL到HDFS/Hive, 导出数据export,增量数据导入, Sqoop job,常用命令及参数

sqoop从mysql导入hive

Sqoop 从mysql导入hive

sqoop增量数据导入hive表的方法

利用sqoop将hive数据导入导出数据到mysql

使用sqoop从mysql导入到hive基本操作

sqoop命令，mysql导入到hdfs、hbase、hive

sqoop将mysql的数据导入到hive表中

用sqoop将mysql的数据导入到hive表

从mysql用sqoop导入到hive的具体步骤

sqoop从hive导入数据到mysql时出现主键冲突

SQOOP通过MyCat从MySQL导入数据到Hive

sqoop+crontab（mysql表定期导入到hive）

sqoop 数据从hive导入到mysql 遇到的坑

使用sqoop将mysql数据导入到hive中

sqoop: mysql导入数据到hdfs, hive, hbase

SQOOP 从 MySQL 导入到 Hive 之 Python 脚本

利用sqoop指定列指定条件的方式将数据从mysql中增量导入hive表中

mysql 通过sqoop导入hive

Sqoop导入导出——hive＜=＞mysql

大数据之Sqoop（一） --- Sqoop简介，安装和配置，MySQL数据的导入导出到HDFS，Hive，HBase，Sqoop Job，增量导入

Sqoop增量同步mysql/oracle数据到hive(merge-key/append）测试文档

Sqoop- sqoop将mysql数据表导入到hive报错（未解决）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)