sqoop的全量导入，增量导入2种，减量导入 - 代码天地

sqoop的全量导入，增量导入2种，减量导入

其他 2018-11-16 08:40:53 阅读次数: 0

全量导入：将mysql表中全部数据都导入HDFS，如果HDFS中存在这个目录的话就会报错，默认存储的HDFS目录是 /user/root/XXX,括号中的内容都为解释，要运行的话就一行一行粘贴一起运行

bin/sqoop import (在sqoop的安装目录内，import表名是导入)

--connect jdbc:mysql://192.168.5.120:3306/myhive （连接：协议：数据库类型：//ip地址：端口号/数据库）

--username root （用户名 root）

--password 123456 （密码 123456）

--table person （表 person）

--m 1 (--num-mappers:使用几个mapper，写1就可以)

增量导入：将数据库中某一字段，增加的导入，在hdfs上单独形成一个文件

bin/sqoop import （同上）

--connect jdbc:mysql://192.168.5.120:3306/myhive （同上）

--username root （同上）

--password 123456 （同上）

--table person （同上）

--incremental append (表明增量导入)

--check-column id （检查哪个字段，这里检查的是mysql数据库表中的id字段）

--last-value 4 （id字段最后一个id是4，那增量导入的话就是从id=5开始往后导入）

--m 1 （同上）

增量导入2或减量导入：设置where条件，通过条件可以判断减少的数据和增加的数据，控制更加灵活一些，例如可以通过时间来判断数据是哪一天生成的等

千万注意：where条件的地方都是用“”双引号引起来的！！！，要不然where条件失效

bin/sqoop import （同上）

--connect jdbc:mysql://192.168.5.120:3306/myhive （同上）

--username root （同上）

--password 123456 （同上）

--table person （同上）

--incremental append （表明增量导入）

--where “age>30“ （where条件判断，精华所在，双引号引起来）

--check-column id （检查列，好像没有什么卵用）

-m 1 （同上）

猜你喜欢

转载自blog.csdn.net/weixin_42333583/article/details/83903057

sqoop的全量导入，增量导入2种，减量导入

sqoop全量导入增量导入及合并

Sqoop全量数据导入、增量数据导入、并发导入

sqoop增量导入、全量导入、选择导入

Sqoop--全量/增量、导入/导出

Sqoop全量数据导入、增量数据导入、并发导入（Sqoop进阶）

sqoop参数详解（全量、增量导入导出）

sqoop增量导入

sqoop增量数据导入

Sqoop从Mysql全量定时导入Hive

sqoop自动增量导入报错

（转）Mysql数据导入ES（全量+增量）

sqoop实战一增量导入hdfs

sqoop增量数据导入hive表的方法

sqoop 导入增量数据到hive

大数据--sqoop数据增量导入

sqoop增量导入hdfs和导出

Sqoop导入

转：solr 从数据库导入数据，全量索引和增量索引（实例&配置&原理）

Sqoop1.4.4原生增量导入特性探秘

sqoop从mysql到hive实现定时增量导入

写一个sqoop增量导入的shell脚本

Sqoop --增量导入，更新导出（updateonly模式），（allowinsert模式）

Sqoop --增量导入，更新导出（updateonly模式），（allowinsert模式）

HADOOP学习笔记6 Sqoop增量数据导入实战

记sqoop将mysql数据增量导入hdfs的致命问题

sqoop 数据导入脚本

sqoop MySQL导入Hbase

sqoop导入Hive配置

sqoop导入导出练习

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)