Spark案例之根据ip地址计算归属地二 - 代码天地

Spark案例之根据ip地址计算归属地二

其他 2018-10-18 23:32:09 阅读次数: 0

之前的是单机版的根据ip地址计算归属地，当数据量小的时候还可以，但是在大数据实际生产中是不行的，必须将它改造成一个Spark程序，然后在Spark集群上运行

Spark程序和单机版的程序不一样，下面来仔细分析一下Spark程序的运行流程

首先是一个Spark集群，集群中有Master和Worker，启动Master和Worker之后，Worker会和Master建立连接并向Master发送心跳，这时候提交一个SparkSubmit，也就是Driver给Master，然后Master会向Spark进行通信，让Worker启动Executor，然后Executor就会和Driver就行通信了，根据ip地址计算出归属地这个Spark程序是写在Driver端的，但是执行计算是在Execoutor端，也就是说Driver端只告诉执行逻辑，并不参与任何的计算和存储，在Driver端创建了RDD之后，一旦出发执行就会创建Task，然后Driver会通过网络发送到Executor端，然后会在Executor端实现根据ip地址计算出归属地的结果，但是如果ip地址的规则文件不是放在hdfs中的，而是放在Driver端的机器上的，那么Executor端计算的时候就拿不到这个ip地址规则文件，这个时候就引出了Spark中的广播变量了，Driver通过网络将ip地址规则发送个每个Executor上，Executor上的多个Task通过这个ip地址规则来进行匹配，匹配结束之后会生成许多小文件，然后将相同分区的文件聚合到一起，最后存储到Mysql中

猜你喜欢

转载自blog.csdn.net/ys_230014/article/details/83038929

Spark案例之根据ip地址计算归属地二

Spark案例之根据ip地址计算归属地四

Spark案例之根据ip地址计算归属地三

Spark案例之根据ip地址计算归属地一

Spark- 根据ip地址计算归属地

spark小案例---根据IP计算归属地

根据ip地址计算归属地

数据分析案例3 海量数据分析---根据Ip地址计算归属地的需求

Java根据ip地址获取归属地

spark学习五——归属地计算案例

Java根据IP地址获取对应归属地

根据IP获取归属地

spark例子ip归属地查询

Python实现IP地址归属地查询

Java实现IP地址归属地查询

ip地址以及归属地查询

requests库之IP归属地查询

Python爬虫之Requests库——IP地址归属地自动查询

Python网络爬虫与信息提取（3）—— 实战之IP地址归属地查询

Python爬虫入门实例六之IP地址归属地的自动查询

切割地址，手机号归属地，IP归属地

IP归属地查询

spark中ip归属地访问的次数练习

手机归属地_IP地址API 整理

利用python爬取IP地址归属地等信息！

golang IP地址归属地查询（walk界面库）

实例5：IP地址归属地的自动查询

IP归属地与IP定位

php获取ip归属地

Java获取IP及归属地

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)