Sqoop把hive中的数据导出到mysql中 - 代码天地

Sqoop把hive中的数据导出到mysql中

编程语言 2018-12-02 17:48:47 阅读次数: 0

首先

官网上对sqoop的定义是：

Sqoop是一个被设计用来在hadoop大数据平台和结构化数据库（比如关系型数据库）之间传输批量数据的一个工具。既然是一个工具那么用起来应该是比较简单的，可是实际操作时总会出现这样或者那样的错误。

由于工作中会有各种各样的需求，但是大多最终计算的结果都要以excel的形式给到需求方，数据量不太大的时候可以使用navicat自带的导出功能或者hue的导出功能就可以直接把数据导成excel或者其他格式的文件，但是数据量一旦太大的话，这些工具对于一次性导出的数据量是有限制的，此时相对来说sqoop比较好一些，因为sqoop的底层是走mapreduce程序所以会比较稳定，而且对数据量没有限制。当然也可以使用spark的bulkload方式，不过spark是基于内存处理的，设计好的话应该也是没有问题的。

这里我打算把hive中的一张表skuattributes 导出到mysql中：

Hive中这张表的表结构是：

字段类型都是string类型的，此时要在mysql中创建好表结构相同的一张表：

我给它命名成相同的名字：skuattributes;

Mysql 中创建的表结构信息：

Mysql中没有string类型，可以用varchar类型代替（varchar是可变长字符串类型）

这样就建好了与hive对应的表

下面开始使用sqoop导出语句：

然而执行结果却报错了：

说找不到manager：

仔细查看发现url写错啦，

红线地方少些冒号：

加上之后：

重新执行

一共导出2966条数据，到底对不对呢，我去hive中查一下：

的确是2966条数据：

最后再去mysql中查看一下数据量对不对：

确认过眼神是对的没错啦。

其实原理是不难的，就是语句调试以及出现的一些语法错误。

Hive中查看表的hdfs路径可以直接在hive命令行中输入：

Desc formatted tablename;

其中location对应的就是表在hdfs上的路径信息啦

今天就写到这了。

猜你喜欢

转载自blog.csdn.net/qq_40659784/article/details/84708661

Sqoop把hive中的数据导出到mysql中

利用sqoop将hive中的数据导出到mysql中

sqoop将hive的数据导出到mysql中

Sqoop hive数据导出到mysql

sqoop从hdfs导出到mysql中

sqoop导出到hive

sqoop导出到hive数据增多

十八、通过Sqoop2-Shell将HDFS中的数据导出到MySQL

sqoop 数据导出，hive -->mysql

sqoop导出到mysql数据库

Sqoop从Mysql导出到Hive的几个需要注意的地方

mysql 查询数据导出到文件中

sqoop：导出MySQL数据至Hive时，数据中包含\001或\n等字符

大数据之Sqoop（一） --- Sqoop简介，安装和配置，MySQL数据的导入导出到HDFS，Hive，HBase，Sqoop Job，增量导入

从hive将数据导出到mysql

sqoop从hive、hdfs导入导出数据（mysql）

使用sqoop从Hive导出数据到MySQL

Sqoop 从hive导出mysql

sqoop详细例子-按天定时把postgresql数据库中的数据导出到hdfs

Sqoop将HBase表数据导出到MySQL

利用Sqoop把SqlServer数据库中的表导入导出到HDFS

sqoop导入导出到mysql，hbase，hive,hdfs系统，多表关联导出案例

sqoop将mysql的数据导入到hive表中

使用sqoop将mysql中的数据导入Hive时报错

使用sqoop将mysql数据导入到hive中

oracle/mysql 将查询数据导出到文件中

sqoop将hive数据导出到关系型数据库

Sqoop导出到MySQL中文乱码问题

Sqoop导入导出——hive＜=＞mysql

利用sqoop将hive数据导入导出数据到mysql

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)