hive（3）——在hive中使用自己写的函数（python实现） - 代码天地

hive（3）——在hive中使用自己写的函数（python实现）

其他 2020-10-16 05:39:50 阅读次数: 0

如果我们想在hive中添加自己写的函数，可用如下方法：
前提：已经开启hdfs，yarn服务，并且关闭safe模式，打开mysql
ps：udf是mapper类型的，进来一个数据，出去一个数据
（1）用python写好想要实现的函数
这里我的测试表是这样一份表，我想让此表的state字段都变成大写，所以我编辑了如下python脚本：
在这里插入图片描述

编辑的脚本py_udf（udf前面已经解释）如下：

import sys
for line in sys.stdin:
        line = line.strip()
        team,state,rank = line.split()
        state = state.upper()
        print( ' '.join([team,state,str(rank)]))

（2）加入路径（至关重要的一步）
这份文件在本地路径下
在这里插入图片描述
（3）实现语句TRANSFORM

可见，california和colorado已经大写，成功输出，这里要使用TRANSFORM 前面的‘（）’的参数是你表中的字段，也就是desc查出来的字段，而后面的‘（）’的参数是你pyhon脚本里输出的参数。
可以在yarn可视化界面查看该任务：
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_48445640/article/details/109017316

hive（3）——在hive中使用自己写的函数（python实现）

Hue中使用Hive的UDF、UDTF函数

Python 3 使用Hive 总结

hive中使用rcfile

用python实现Hive中的UDF函数

hive中使用sql window函数 LAG/LEAD/FIRST/LAST

Hive中使用 with as 优化SQL

Hive中使用MAP JOIN

HIVE的transform函数的使用

hive：函数使用

hive 使用反射函数

hive使用UDF函数

Hive常用函数使用

hive窗口函数使用

hive 函数使用详解

Hive特殊函数的使用

hive中使用标准sql实现分组内排序

关于在hive中使用python做UDF的总结

hive（3）——使用mapreduce

Hive之 Python写UDF

python 中写hive 脚本

什么是hive Hadoop Hive概念学习系列之什么是Hive？ 2 hive的使用 + hive的常用语法 2 hive的使用 + hive的常用语法 3 hql语法及自定义函数

Hive使用pmod函数实现dayofweek函数功能

【Hive十八】Hive QL中使用配置的变量

hive：函数：聚合函数：count() 及多用法之count中使用函数

Hadoop Hive概念学习系列之什么是Hive？ 2 hive的使用 + hive的常用语法 2 hive的使用 + hive的常用语法 3 hql语法及自定义函数

hive函数大全及使用示例

hive 窗口函数高级使用

Hive Beeline窗体函数使用

Hive中的时间函数的使用

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)