利用基于Azure的Informatica大数据管理解决方案 五步构建数据湖

作为一个集成化的数据管理解决方案,Informatica大数据管理(BDM)提供了可以全面、快速地对企业的大数据进行集成、治理并保障安全。它还完全支持微软Azure生态系统。

Informatica大数据管理+微软Azure,将帮助您共同解决Azure上的数据湖应用场景问题。上图展示了一个代表性客户使用基于Azure的Informatica大数据管理工具实施数据湖解决方案的情景。

五步构建数据湖

  • 作为开始,收集内部系统的数据并迁移到微软Azure数据湖资源库(ADLS)。您可以考虑卸载不常用的数据,并将原始数据批量加载到一个在微软Azure数据湖资源库中定义好的着陆区。
  • 收集云应用以及机器和传感器产生的流数据,直接传送给微软Azure数据湖资源库,而不是集结在临时的文件系统或数据仓库中。
  • 对存放在微软Azure数据湖资源库中的数据进行发现和剖析。剖析数据是为了更好地理解它的结构和语境。
  • 对来自网络日志、应用服务器日志的数据或传感器的数据进行解析和备置。一般而言,这些数据的格式是多结构或非结构化的,可以对这些数据进行解析,以提取不同特征和实体,还可以用到数据质量技术。
  • 在微软Azure HDInsight上完成数据清洗和转换后,将高价值的编辑数据迁移到微软Azure数据湖资源库或微软Azure SQL数据仓库中。用户可以直接从那里通过商业智能(BI)报表和应用程序实现数据访问。

Informatica大数据管理优势

在基于Azure的数据湖实施方面,Informatica大数据管理能够提供以下功能集合:

  • 易于部署:Informatica大数据管理方案已被列在微软Azure市场中。客户仅需单击鼠标就可以开始部署。
  • 连通性:Informatica大数据管理提供读、写功能,以连接任何内部数据库、云资源、微软Azure blob、Azure数据湖资源库等。
  • 数据准备:Informatica大数据管理提供丰富的数据集成和数据质量功能,以在Hadoop上进行数据准备。
  • Hadoop集成:Informatica大数据管理可以将数据集成和数据质量作业推送给微软Azure HDInsight或任何其他的Hadoop分发系统。

应用基于Azure的Informatica数据湖管理解决方案,您可以利用大数据提升观察和分析能力,同时加快您的数据驱动式数字化转型的进程。

猜你喜欢

转载自blog.csdn.net/weixin_43696133/article/details/85758785