Hive return code 2以及concat与concat_ws的区别 - 代码天地

Hive return code 2以及concat与concat_ws的区别

业界资讯 2023-06-12 05:47:56 阅读次数: 0

（作者：陈玓玏data-master.net）

一、 Return code 2错误

用hive跑数的时候，常会碰到一个错误：

FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

关于这个错误，网上有挺多解决方法的，有说将引擎换成Tez的，这个我试过，似乎没成功，有的人成功了。说明这个return code 2的根本原因可能是不一样的。有说是数据量的问题的，这种情况我也碰到过，就是join了一个超大的表，并且主键还很多重复的，造成了数据爆炸，把那个join的过程去掉之后，问题就解决了。

关于这个错误，最靠谱的说法还是：**这个错误其实不是最本质的错误，需要去查看日志才行的。**下面说一个我查日志查出来的bug，年代久远，日志截图没保存，只能说是在hadoop web ui上面查的，聪明的你一定知道怎么查日志。

二、 Concat_ws和concat

这个具体的问题就是，我在做特征工程的时候，用了concat(A,B)这样的函数+str_to_map来做同中间表上不同的衍生逻辑生成多个特征的操作。这个操作在hive里总是给我报错return code 2，但是在spark-sql里面竟然不报错？

这个原因我查了半天（一开始不懂看日志，用spark-sql就这么稀里糊涂地跑了结果）。然后，检查结果数据的时候，问题就暴露出来了。比如，我的基础表里面，明明有数据A，但是没有数据B，那么我所希望的concat(A,B)的结果是AB这样的形式，结果spark-sql跑出来的是空。这时候我才想起去看看hive日志里报的错，它的意思是：concat不能有空值。恍然大悟，hive在concat处理到空值的时候，选择报错，spark-sql则默认结果为空值了。因此，关键的问题就是处理concat里面空值的问题。

最终，我采用的是把concat(A,B)换成concat_ws(‘’,A,B)，concat_ws可以处理空值，最终A存在B为空的这种情况，结果是我所期望的A，而不再是空。

所以啊，两个结论：

return code 2还是得去查hive日志，不能因为有时候spark-sql不报错就不管哦。
另一个，如果要拼接的元素里有可能有空值，推荐用concat_ws而不是concat哦。

希望大家的代码都少少bug~

猜你喜欢

转载自blog.csdn.net/weixin_39750084/article/details/106462632

Hive return code 2以及concat与concat_ws的区别

hive return code 2的问题

hive：concat与concat_ws区别

【Hive】函数 concat 、concat_ws 、concat_group 的区别

hive：函数：concat 和 concat_ws

hive中的concat，concat_ws，collect_set用法

Hive函数collect_set、concat_ws、concat、if

hive经典错误 Error: org.apache.hive.service.cli.HiveSQLException:return code 2

hive -- return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

concat_ws 使用在hive spark-sql上的区别

FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.tez.TezTask

FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

hive 在kettle 作业return code 2 的问题 Unexpected exception: Unexpected exception: Unexpected exception:

hive 中concat_ws和collect_set 用法

hive中的concat_ws合并用法

hive：udf函数和concat_ws连接函数的使用

[Hadoop] Hive查询报错“Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask”

Hive问题：Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

关于HIVE做MapReduce报错:return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

【Hive报错】FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

hive报错Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

Hive任务执行报错：FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

concat与concat_ws区别

hive MapJoin 异常： return code 3 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask

【hive on spark Error】return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask.

【hive】INFO hive.HiveImport: FAILED: Execution Error, return code 1 from org.apache

hive中多行合并一行concat_ws（去重及不去重）

利用Hive中concat_ws函数将多行记录合并成一行

mysql concat与concat_ws区别

Apache Hive 3.X版本 HiveServer2 insert overwrite大量数据报错内存溢出 GC overhead limit exceeded return code -10

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)