实时数据采集流程 - 代码天地

实时数据采集流程

其他 2018-11-02 18:12:50 阅读次数: 0

版权声明： https://blog.csdn.net/KamRoseLee/article/details/83421802

步骤一：

数据来源：比如，网站或者app。非常重要的一点，就是埋点。也就是说，埋点，在网站/app的哪个页面的哪些操作发生时，前端的代码（网站，JavaScript；app，android/IOS），就通过网络请求，（Ajax；socket），向后端的服务器发送指定格式的日志数据。

步骤二：

Nginx，后台Web服务器（Tomcat、Jetty等），后台系统（J2EE、PHP）。到这一步为止，其实还是可以跟我们之前的离线日志收集流程一样。走后面的通过一个日志传输工具，给放入指定的文件夹。

连接线（flume，监控指定的文件夹）

步骤三：

1、HDFS

2、实时数据，通常都是从分布式消息队列集群中读取的，比如Kafka；实时数据，实时的log，实时的写入到消息队列中，比如Kafka；然后呢，再由我们后端的实时数据处理程序（Storm、Spark Streaming），实时从Kafka中读取数据，log日志。然后进行实时的计算和处理。 Kafka

（Kafka，我们的日志数据，怎么处理，都是由你自己决定。可以每天收集一份，放到flume，转移到HDFS里面，清洗后放入Hive，建立离线的数据仓库。也可以每收集1分钟的数据，或者每收集一点数据，就放入文件，然后转移到flume中去，或者直接通过API定制，直接把一条一条的log打入flume。可以配置flume，将数据写入Kafka）

连接线（实时的，主动从Kafka中拉取数据）

步骤四：

大数据实时计算系统，比如说用Storm、Spark Streaming开发的，可以实时的从Kafka中拉取数据，然后对实时的数据进行处理和计算，这里可以封装大量复杂的业务逻辑，甚至调用复杂的机器学习、数据挖掘、智能推荐的算法，然后实现实时的车辆调度、实时推荐、广告流量的实时统计。

猜你喜欢

转载自blog.csdn.net/KamRoseLee/article/details/83421802

实时数据采集流程

10.Spark大型电商项目-大实时数据采集流程介绍

superset采集流程

基于shell,python 简易数据采集流程图

离线日志采集流程

python采集websocket实时数据

Flink实时数仓数据采集

项目一实时数仓数据采集

OBS视频采集流程分析

整合Flume和kafka完成实时数据采集

基于VB 实时数据采集与处理的多线程设计

Flume整合Kafka完成实时数据采集

源码分析 Sentinel 实时数据采集实现原理

新型冠状病毒 - 实时数据采集 | 爬虫篇

SSD训练数据集流程（学习记录）

Spark Streaming实时流处理项目3——整合Flume和Kafka完成实时数据采集

用户行为分析大数据平台之（三）实时数据采集

实时数仓项目(一)数据采集与ODS层数据处理

多线程实时数据采集MFC VISUAL C++ /C++

StreamSets 从Mysql到Hbase(带kerberos认证)的实时数据采集

UVC 摄像头驱动（三）配置摄像头，实时数据采集

Apache Hadoop生态部署-Maxwell(实时数据同步)采集节点安装

获利能力分析实际数据收集流程

简述网络舆情之海量数据收集流程

DeeplabV3+训练数据集流程（学习记录）

Unet语义分割训练数据集流程（学习记录）

使用Faster—RCNN训练数据集流程（学习记录）

构建训练集流程

linux下视频采集流程(V4L2)

9.Spark大型电商项目-离线日志采集流程介绍

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)