etl系统介绍

       etl是Extract-Transform-Load的缩写,从单词的含义上我们可以显而易见它是用来做抽取-转换-加载用的,它是实现数据仓库的过程,它通过把数据从不同的源数据中取到内存中或者放进ods中,然后再把数据进行清洗和规格化后加载进数据仓库里面,这个过程我们就把它称为etl系统。


etl系统的过程可以分成三个部分:

1.抽取:从不同的数据源中抽取自己想要的数据,并对数据做一些简单的处理。

2.转换:把数据进行清洗,合并,统计,去重等操作来将数据变成业务真正需要的数据。

3.加载:将数据加载进相应的维度表,事实表中。

猜你喜欢

转载自blog.csdn.net/pttaoge/article/details/80136660
ETL