数据仓库(ETL)、数据仓库工具Informatica介绍

一、数据仓库(ETL)

数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision-Support)【将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节】。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层—源数据、数据仓库、数据应用

ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、清洗(clear)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

ELT工具:Kettle、Talend、Datastage、Informatica等

二、为什么用Informatica工具

借助Informatica全面、统一、开放且经济的数据管理平台,组织可以在改进数据质量的同时,访问、发现、清洗、集成并交付数据,以提高运营效率并降低运营成本。Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,包括:企业数据集成、大数据管理 、数据质量、数据治理  、主数据管理、数据安全 和云数据集成等。

安装Informatica:https://blog.csdn.net/weixin_41685388/article/details/103574372

更多大数据/数据分析资料关注一下博客,一起学习交流!!!

发布了103 篇原创文章 · 获赞 75 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/weixin_41685388/article/details/103589477