hive数据挂载到Amazon S3时的问题 - 代码天地

hive数据挂载到Amazon S3时的问题

其他 2019-02-21 02:01:04 阅读次数: 0

一、hive数据存放到S3时问题归纳

1.添加分区问题

alter table tableName add if not exists partition (dt='$day') location 's3://$day - （S3路径）';

正常hive表添加分区是默认建立我们指定的分区，在s3上使用默认语句会添加一个dt=日期的一个文件夹，而正常分区目录没有“dt=“，这时需要手动指定数据路径，即在partition后面添加location指定S3数据分区路径。

2.建表S3路径问题

正常S3路径为s3://，infocS3路径s3n://，我们使用的是s3a://，默认S3底层协议都会解析出后面两种，一般情况下不需要改动。如果当我们指定s3://创建目录后，发现添加分区不生效时，有可能走hive的时候没有解析成功，需要手动将s3://改成s3a://。

3.数据格式

（1）LZO

STORED AS INPUTFORMAT 'com.hadoop.mapred.DeprecatedLzoTextInputFormat'

扫描二维码关注公众号，回复： 5250750 查看本文章

（2）ORC

STORED AS ORC;

（3）snappy.orc

STORED AS ORC
TBLPROPERTIES ("orc.compress"="SNAPPY")

（4）txt

Stored as textfile;

4. jets3t-0.9.0.jar

报错：

添加jets3t-0.9.0.jar 包到 hadoop/lib

jar源码，大概跟S3协议有关。

没有此jar包可以查询简单数据，但是不能做运算。

META-INF/MANIFEST.MF
contribs.mx.LongCounter.java
contribs.mx.MxImpl.java
contribs.mx.S3BucketMx.java
contribs.mx.S3BucketMxMBean.java
contribs.mx.S3ObjectMx.java
contribs.mx.S3ObjectMxMBean.java
contribs.mx.S3ServiceErrorCodeTable.java
contribs.mx.S3ServiceExceptionMx.java
contribs.mx.S3ServiceMx.java
contribs.mx.S3ServiceMxMBean.java

有兴趣可以加我的大数据、数据分析、爬虫群：
《453908562》

猜你喜欢

转载自blog.csdn.net/qq_31032181/article/details/84885548

hive数据挂载到Amazon S3时的问题

Amazon S3

Amazon S3数据存储

Java and Amazon S3

Amazon S3 API

Amazon S3 加密

解决访问 Amazon S3 对象时遇到的“访问被拒绝”错误

大数据BigData之hadoop连接Amazon s3时，core-site.xml文件该怎么配置？

Amazon S3 Glacier 将检索大量存档数据时的还原吞吐量提升高达 10 倍

使用amazon的S3服务

amazon s3 简单使用

Amazon S3 功能介绍

Amazon S3 工具及使用

Amazon S3 工具及使用

S3常用功能（amazon）

Amazon aws s3 加速

Amazon S3的使用小结

S3 windows 挂载磁盘

拓展 Amazon S3 技术边界：Amazon S3 Express One Zone 的创新之路

Sqoop导数据 S3 to Mysql

大数据BigData之hive怎么样才能够直接读取amazon s3中的.gz文件数据呢？

AMAZON S3(1)Introduction and File Upload API

freebsd下备份文件至amazon s3

Amazon S3服务简介及基本概念

centos6.8 上传文件到amazon s3

亚马逊Amazon S3 对象存储WEB服务接口

amazon s3 的用户验证 access key secrete key

Amazon AWS S3 java 开发例子

使用 Amazon S3 阻止公有访问

gradle 上传app至Amazon s3

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)