sqoop导入Hive配置 - 代码天地

sqoop导入Hive配置

企业开发 2018-05-13 13:50:44 阅读次数: 2

数据库中经常有换行符之类的数据，导入到Hive里面会发生重大的问题，所以，sqoop是有一个配置项来解决这个问题的。

sqoop import --connect jdbc:oracle:thin:@url --username user --password pwd \
--table PA18ODSDATA.PARTNER_INFO  \
--columns ID_PARTNER_INFO,PARTNER_ID,PARTNER_NAME,PROJECT_ID,PROJECT_NAME\
 -m 1 --fields-terminated-by '\001' --lines-terminated-by '\n' \
--hive-drop-import-delims --hive-import --hive-overwrite \
--hive-table eshop.partner_info

使用 --query 则必须加上 --output-dir，以文本格式导出数据

如果直接导入表，则如上面的代码所示。

其中，去掉--hive-overwrite关键字，就可以给Hive表插入数据，而非覆盖数据。

注意，插入数据的表，必须是text表，或者是sequence表，rcfile表是不支持插入新数据的。

其中，关于Hive的配置解释如下：

详见：

http://sqoop.apache.org/docs/1.4.2/SqoopUserGuide.html

Table�14.�Hive arguments:

Argument	Description
--hive-home <dir>	Override $HIVE_HOME
--hive-import	Import tables into Hive (Uses Hive’s default delimiters if none are set.)
--hive-overwrite	Overwrite existing data in the Hive table.
--create-hive-table	If set, then the job will fail if the target hive
	table exits. By default this property is false.
--hive-table <table-name>	Sets the table name to use when importing to Hive.
--hive-drop-import-delims	*Drops \n, \r, and \01* from string fields when importing to Hive.**
--hive-delims-replacement	*Replace \n, \r, and \01* from string fields with user defined string when importing to Hive.**
--hive-partition-key	Name of a hive field to partition are sharded on
--hive-partition-value <v>	String-value that serves as partition key for this imported into hive in this job.
--map-column-hive <map>	Override default mapping from SQL type to Hive type for configured columns.

猜你喜欢

转载自dacoolbaby.iteye.com/blog/1916272

sqoop导入Hive配置

Sqoop安装配置及Hive导入

sqoop 1.4.7 导入hive

sqoop 导入 hive

sqoop的导入|Hive|Hbase

sqoop导入-hive

Sqoop informix导入hive

sqoop从mysql导入hive

Sqoop 从mysql导入hive

Sqoop安装配置及Mysql->Hive数据导入实践

sqoop导入数据至hive

mysql 通过sqoop导入hive

hive数据导入Sqoop工具

sqoop导入导出hive/oracle

Sqoop导入导出——hive＜=＞mysql

大数据之Sqoop（一） --- Sqoop简介，安装和配置，MySQL数据的导入导出到HDFS，Hive，HBase，Sqoop Job，增量导入

sqoop将hive里的表导入mysql

sqoop hbase导入并与hive结合

sqoop 导入hive分区表的方法

sqoop增量数据导入hive表的方法

使用sqoop从mysql导入数据到hive

sqoop从hive、hdfs导入导出数据（mysql）

Sqoop从Mysql全量定时导入Hive

sqoop使用，从hive向oracle导入数据

sqoop--mysql表导入hive

sqoop 导入增量数据到hive

sqoop导入hive bug (未解决)

sqoop 1.x 导入hive 整合

# Sqoop从Mysql导入数据到Hive

sqoop从mysql导入数据到hive

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)