【原创】大叔经验分享（86）hive和mysql数据互导 - 代码天地

【原创】大叔经验分享（86）hive和mysql数据互导

其他 2019-10-10 12:07:15 阅读次数: 0

hive和mysql数据互导，首先想到的是sqoop，并且可以和调度框架（比如oozie等）配合配置定时任务，还有一种更简单的方式是通过spark-sql：

CREATE OR REPLACE TEMPORARY VIEW tmp_tbl_test
USING org.apache.spark.sql.jdbc OPTIONS (
url "jdbc:mysql://1.1.1.1:3306/db_test?useUnicode=true&characterEncoding=utf-8&tinyInt1isBit=false",
dbtable "tbl_test",
user 'root',
password '123456');

然后可以在spark-sql中对tmp_tbl_test读或者写，相当于直接对mysql进行读或者写，
如果只需要读，甚至不需要将数据从mysql先导到hive，而是直接读mysql；

另外注意连接串中的tinyInt1isBit=false，由于spark-sql和sqoop都是基于jdbc来读mysql，然后jdbc中会将mysql的字段类型tinyint默认认为是java.sql.Types.BIT，进而读出来的不是数字int，而是布尔值Boolean，如果不需要这种默认行为，则需要在连接串中增加tinyInt1isBit=false；

猜你喜欢

转载自www.cnblogs.com/barneywill/p/11647014.html

【原创】大叔经验分享（86）hive和mysql数据互导

【原创】大叔经验分享（100）Atlas导入hive元数据

Hive和MySQL数据互导

【原创】大叔经验分享（25）hive通过外部表读写hbase数据

【原创】大叔经验分享（24）hive metastore的几种部署方式

【原创】大叔经验分享（65）spark读取不到hive表

【原创】大叔经验分享（78）hive查询报错NoViableAltException

【原创】大叔经验分享（60）hive和spark读取kudu表

【原创】大叔经验分享（50）hue访问mysql（librdbms）

【原创】大叔经验分享（104）mysql启动失败

【原创】大叔经验分享（29）cdh5使用已存在的metastore数据库部署hive

【原创】大叔经验分享（113）markdown语法

【原创】大叔经验分享（109）emacs使用

【原创】大叔经验分享（84）spark sql中设置hive.exec.max.dynamic.partitions无效

【原创】大叔经验分享（90）linux服务器iowait和负载很高

【原创】大叔经验分享（30）CM开启kerberos

【原创】大叔经验分享（35）lzo格式支持

【原创】大叔经验分享（39）spark cache unpersist级联操作

【原创】大叔经验分享（42）云主机挖矿病毒现象

【原创】大叔经验分享（40）hdfs关闭kerberos

【原创】大叔经验分享（47）yarn开启日志归集

【原创】大叔经验分享（52）ClouderaManager修改配置报错

【原创】大叔经验分享（57）hue启动coordinator时报错

【原创】大叔经验分享（59）kudu查看table size

【原创】大叔经验分享（73）scala akka actor

【原创】大叔经验分享（74）nginx对静态文件加速

【原创】大叔经验分享（81）marathon上app无法重启

【原创】大叔经验分享（83）impala执行多个select distinct

【原创】大叔经验分享（98）mesos slave启动失败

【原创】大叔经验分享（92）阿里云主机磁盘扩容

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)