十、批流一体流程化大数据架构设计

1、技术背景

        在当代信息社会中,数据的处理和分析已经成为了一个重要的议题,大量的数据处理需求推动了数据处理技术不断的发展,出现了很多解决海量数据处理的软件方案。然而,当前的处理方案往往存在着数据处理不能实时、配置复杂、处理过程不规范,不适用于异构平台的问题。因此,如何解决异构平台下海量数据高效处理的问题成为了数据处理技术的新的研究方向。

        本设计提出了一种数据处理的图形化、流程化、自动化的解决方案,主要特点有。

1、开发配置图形化:使用可视化的图形组件,通过拖拉拽、点选和设置属性等方式来完成数据处理各过程的配置。在这种环境中,开发人员不需要手动编写代码,而是利用图形UI和复用接口来完成功能。

2、数据实时同步采集:采用先进的CDC(Change Data Capture)方案,通过不断监控原始数据系统的更改,提取,转换并将它们分发到目标数据库,可近乎实时地实现数据的增量加载。

3、批流一体化计算:批处理只能对一段时间内的固定数据集离线进行处理,而流处理则是对数据流进行实时处理,处理的方式是持续不断的输入和输出,需要依赖于消息服务器的异步传输机制。本发明将批处理和流处理技术进行深度整合&#

猜你喜欢

转载自blog.csdn.net/vandh/article/details/131909473