sqoop复习01

sqoop复习01

  Sqoop是apache旗下一款“hadoop和关系型数据库服务器之间传送数据”的工具。
导入数据:Mysql、Oracle导入数据到Hadoop的HDFS、Hive、Hbase等数据存储系统;
导出数据;从Hadoop的文件系统中导出数据到关系型数据库中

原理:将导入导出命令翻译成mapreduce程序来实现,在翻译出的MapReduce中主要是对inputformat和outputformat进行定制。
sqoop导入:

1、全量导入
1.1、mysql->hdfs
1.2、mysql->hive
1.3、导入表数据子集
2、增量导入
2.1、append模式
2.2、lastmodified模式
2.2.1、append模式
2.2.2、merge-key模式
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/AnlaGodness/article/details/107203700