关于在hive中使用python做UDF的总结 - 代码天地

关于在hive中使用python做UDF的总结

其他 2020-04-09 16:17:33 阅读次数: 0

主要是利用hive提供的transform语句。

1.编写python脚本，python脚本数据如下（参考：https://dwgeek.com/hive-udf-using-python-use-python-script-into-hive-example.html/）：

import sys
for line in sys.stdin:
    line = line.strip('\n\r')
    fname , lname = line.split('\t')
    firstname = fname.title()
    lastname = lname.title()
    print '\t'.join([firstname, lastname])

2.在hive CLI中增加python脚本，脚本可以放到服务器本地目录或者hdfs中，依据py脚本所处的位置使用不同的add file语句。

--在服务器本地目录时
add file initCap.py

--在hdfs时
add file hdfs:///tmp/initCap.py

由于我们的hive配置了sentry权限控制，经测试只有hive CLI能够执行add file，用beeline或者其它客户端的时候会报没有权限的问题，具体原因还不知道。

3. 在hive sql中使用刚才我们添加的python脚本，示例sql如下：

select transform('abc\tdef') using 'python initCap.py' as (col_name,khjd);

以上。

猜你喜欢

转载自www.cnblogs.com/vanwoos/p/12667515.html

关于在hive中使用python做UDF的总结

使用Python编写Hive UDF

Hive & Impala中使用UDF开发

Hue中使用Hive的UDF、UDTF函数

0011-如何在Hive & Impala中使用UDF

python hive udf开发

hive udf 使用示例

hive udf使用

hive开发UDF及使用

hive使用UDF函数

python实现Spark(Hive) SQL中UDF的使用

Hive 使用 Python 的UDF 对大量日志进行分词统计

如何在 Apache Flink 1.10 中使用 Python UDF?

Hive之 Python写UDF

Python实现Hive的UDF（案例）

Hive之UDF定义与使用

在Apache Spark中使用UDF

关于Hive(四) 用户定义函数UDF

hive中UDF是什么？如何构建和使用UDF

hive UDF

用python实现Hive中的UDF函数

hive:创建自定义python UDF

hive中UDF、UDAF和UDTF使用

Spark、Hive UDF函数使用汇总

Python 3 使用Hive 总结

hive（3）——在hive中使用自己写的函数（python实现）

spark中使用udf执行filter

Python中使用caffe做目标检测

使用python做爬虫总结

hive中使用rcfile

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)