解决spark streaming重复提交第三方jar包问题 - 代码天地

解决spark streaming重复提交第三方jar包问题

其他 2018-11-02 19:41:40 阅读次数: 0

版权声明：本文为博主原创，欢迎转载，转载请标明出处 Blog Address:http://blog.csdn.net/jsjsjs1789 https://blog.csdn.net/jsjsjs1789/article/details/82902292

背景：
由于spark streaming每次提交都需要上传大量jar包到hdfs，为节约HDFS资源，现只存一份来解决这个问题

组件：
CDH 5.13 spark2.2.x

针对cluster模式
对于spark streaming而言，第三方jar包是一个值得探讨的问题，相信大部分都是打的源码包，然后提交jar，想通过–jars $(echo sparklib0.10/*.jar | tr ’ ’ ‘,’) 这种方式，但这种方式有一个弊端就是每一个application都需要提交大量的jar包，
在这里插入图片描述
并且这些jar包有大部分是可以在多个application中公用的，故直接将这些公用jar传到HDFS上，然后通过

--jars $(`echo hadoop fs -ls hdfs://nameservice1/sparklib010/*.jar` |awk {'print $8'}| tr '\n' ',')

来进行提交，
在这里插入图片描述
非公共部分，可继续使用–jars来提交

--jars $(echo sparklib0.10/*.jar | tr ' ' ',')

整体上是这个样子的

--jars $(`echo hadoop fs -ls hdfs://nameservice1/sparklib010/*.jar` |awk {'print $8'}| tr '\n' ',') --jars  --jars $(echo sparklib0.10/*.jar | tr ' ' ',')

client模式
对于HDFS上的包，首次使用它会下载下来，然后在传上去，用不用公共包自行定夺喽
在这里插入图片描述

我的博客即将同步至腾讯云+社区，邀请大家一同入驻：https://cloud.tencent.com/developer/support-plan?invite_code=2d706r5fp5lw8

猜你喜欢

转载自blog.csdn.net/jsjsjs1789/article/details/82902292

解决spark streaming重复提交第三方jar包问题

Spark 使用第三方 Jar 包的方式

springboot打jar/war包解决第三方依赖jar包的问题

springboot解决第三方依赖jar包

Spring Boot 解决第三方依赖jar包问题

spring boot解决第三方jar包依赖的问题

springboot解决第三方依赖jar包的问题

解决maven打包打不进lib下的第三方jar包问题

Springboot工程使用第三方Jar包遇到的问题及解决办法

解决导入第三方框架v4包重复依赖的问题

【解决方案】解决maven打包打不进lib下的第三方jar包问题

spark应用程序引用第三方的jar包(转载备用)

Android将Activity打成jar包供第三方调用（解决资源文件不能打包的问题）

eclipse 开导入android 第三方jar包java heap space问题解决

Android Studio 怎么添加使用第三方jar包及无法编译的问题解决方法

Maven私服上使用自己的私服下载不了第三方jar包的问题解决

Spark应用程序第三方jar文件依赖解决方案

项目引入第三方jar包，maven打包时，找不到相关第三方的jar包解决办法

aar中引用的第三方jar与引用aar项目重复解决方案

springboot项目第三方jar包引入&&jia包冲突解决

SpringBoot项目中解决引入第三方jar包，打成war包的

spark程序打包为jar包，并且导出所有第三方依赖的jar包

Zookeeper+Kafka+Spark 管理offset 出现第三方jar版问题

Eclipse 无法查看第三方jar包文件源代码解决方法

无法查看第三方jar包源码解决

android 平台集成第三方jar包报错--个人解决方案

Eclipse无法查看第三方jar包文件源代码解决方法

Eclipse无法查看第三方jar包源代码解决

SpringBoot解决第三方依赖jar包(即Maven仓库上没有的jar包，只能找其它资源下载)的问题

spark-submit 依赖第三方包

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)