在spark udf中读取hdfs上的文件 - 代码天地

在spark udf中读取hdfs上的文件

其他 2019-09-05 17:47:54 阅读次数: 0

某些场景下，我们在写UDF实现业务逻辑时候，可能需要去读取某个配置文件。

大多时候我们都会将此文件上传个hdfs某个路径下，然后通过hdfs api读取该文件，但是需要注意：

　　UDF中读取文件部分最好放在静态代码块中（只会在类加载时候读取一次），尤其在处理的数据量比较大的时候，否则会反反复复的读取，造成不必要的开销，甚至任务失败，示例代码如下：

package cn.com.dtmobile.udf;

import java.util.HashMap;

import org.apache.spark.sql.api.java.UDF2;

import cn.com.dtmobile.util.HdfsUtil;

public class CalculateRsrp implements UDF2<Double, String, Double> {

    private static final long serialVersionUID = 1L;

    private static HashMap<String,Double> paramteres = null;
    static {
        paramteres = HdfsUtil.readHdfsFile("your file location");
    }
    
    @Override
    public Double call(Double t1, String t2) throws Exception {

        // 处理逻辑
        
        return null;
    }

}

猜你喜欢

转载自www.cnblogs.com/dtmobile-ksw/p/11468557.html

在spark udf中读取hdfs上的文件

Spark读取HDFS中的Zip文件

Spark HadoopRDD读取HDFS文件

Spark读取与保存hdfs文件

Spark读取HDFS路径文件

spark读取hdfs上的bson包，并解析

spark读取hdfs上的json数据

Spark读取本地文件和HDFS文件

spark 中删除HDFS文件

spark读取HDFS多个文件配置

spark读取hdfs上文件打包运行

spark中UDF，从文件中读取数据（两种方式），然后输出【java版纯代码】

Spark读取HDFS某个路径下的子文件夹中的所有文件

Idea用spark读取hdfs上数据遇坑

Spark读取Es写入Hdfs

Spark读取HDFS或者AFS等文件系统文件

【Spark】Spark中的Partitioner

Spark core通过textFile读取Hdfs文件blockSize如何设置？

spark读取sequenceFile文件

Spark读取本地文件

【Spark五十五】Spark读取csv文件

HDFS上传文件与Spark执行

Spark SQL中UDF和UDAF

spark sql中的udf和udaf实现

Spark中UDF、UDAF、UDTF的使用

Spark之UDF

Spark UDF 学习笔记

Spark SQL UDF示例

Spark - 动态注册UDF

Spark SQL UDF开发

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)