为什么ELT更适合于企业数据应用？ - 代码天地

为什么ELT更适合于企业数据应用？

其他 2019-05-14 14:08:04 阅读次数: 0

为什么ELT更适合于企业数据应用

DataPipeline 陈肃

为什么现在企业环境中，一个ELT的方案会比ETL的方案更有优势，实际上是由企业数据应用特点决定的。

首先在一个企业数据应用里面我们对数据转换的灵活性要求越来越高，传统来说如果是BI应用可能相对来说是比较容易抽象的。但是现在大量企业在开发各种各样AI应用，AI应用有一个非常大的特点，它对于特征的抽取转化的过程是根据算法决定的，其实没有一个通用的方案能够使用一个ETL工具完成AI应用所需要的数据转换工作。

通常情况下，特征的抽取计算是你所使用AI应用框架的一部分。所以很多时候你不能依赖一个ETL工具来完成这个工作，而是应该把原始数据尽可能按照原貌进行一个轻度清洗，然后放到下游计算框架中去使用。

第二，我们注意到在企业里面同样的数据经常有不同的应用去使用。我以前在一家线上教育公司，我们把所有的数据会放在统一的数据仓库里面，包括用户的行为数据、学习数据等。基于这些数据我们会开发各种各样的应用，比如说向用户去推荐我们的课程、向用户提供自适应的学习功能。这些数据你不太容易在从数据源抽取出来的时候，就转换成为具体应用所需的特定结果，所以尽可能保持数据的原样。

第三，我们认为做一个数据集成方案的时候，需要考虑到一个很重要的问题是整个下游系统的可维护性和扩展性。如果你依赖于一个ETL工具在抽取数据过程中做大量的转化，我们知道一个transformation的过程可能是计算密集的，维护这个专有的集群需要付出额外的采购成本和维护成本的。而如果你使用一个ELT的方案，所有的转换都是跟着应用走的，你可以使用任何熟悉的计算框架，Spark也好、Kafka Streams也好，这个是根据自身的特点决定的，它不需要跟特定的ETL工具绑定，无论是成本还是灵活性上它都是具有一定优势的。

猜你喜欢

转载自www.cnblogs.com/DataPipeline2018/p/10861718.html

为什么ELT更适合于企业数据应用？

Stack Overflow 更适合于技术讨论，而邮件组则不然

贝医生创始人章骏：做出更适合于中国人的牙刷

【IDEA&&Eclipse】1、为何 IntelliJ IDEA 比 Eclipse 更适合于专业java开发者

WS-*和REST服务哪一个机制更适合于和亚马逊简单存储服务（S3）进行通信？为什么？（这是一篇不负责任的博文，在线找虐）

elementUi——适合于Vue的UI框架

Linux 系统是否适合于您？

什么样的项目最适合于敏捷开发-Scrum中文网

Python适合于人工智能吗它本身有什么特征

android：SharedPreferences 保存数据（适合于保存上一次用户名与密码）

一种适合于大数据的并行坐标下降法

适合于物联网通信的数据加密AES算法

Java电子招投标采购系统源码-适合于招标代理、政府采购、企业采购、工程交易等业务的企业

Java电子招投标采购系统源码-适合于招标代理、政府采购、企业采购、等业务的企业 tbms

Java电子招投标采购系统源码-适合于招标代理、政府采购、企业采购、等业务的企业

适合于IDEA的Sublime颜色样式

LED驱动芯片AMC7135适合于DIY

适合于初学者循序渐进的好书

params与query分别适合于何种场景？

适合于高速道路交通研究的库------Einspy

免费IP为何不适合于爬虫

为何免费IP不适合于爬虫代理

20190308----elementUi——适合于Vue的UI框架

elementUi--适合于Vue的UI框架

为什么说B+树比B树更适合数据库索引？

适合于企业对电子图文档加密的软件加密工具，2020江苏企业易于操作的公司版本加密软件，无锡风奥科技

为什么Eureka比ZooKeeper更适合做服务发现？

为什么我觉得 nio 比 aio 更适合高并发

FPY与RTY的含义与区别，为什么RTY比FPY更适合？

哪些人更适合学习Python?为什么?

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)