Kettle优化就这么多 - 代码天地

Kettle优化就这么多

其他 2018-09-01 18:28:28 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/ClamReason/article/details/49930479

Kettle正常转换速度

场景	正常	不正常
数据库操作	3k-2w条/秒	2000条/秒以下
文件操作	2w条/秒以上	1w条以下
http、get、set	比数据库慢

容易产生性能问题的场景

查询类：

数据库查询：数据库查询、数据库连接、插入更新

Web查询：http/get/set webservice

计算类

格式转换（字节与字符互相转换，日期）、

转换一般用计算器和JavaScript方法。

排序类

排序、合并连接（依赖于排序）、分组（依赖于排序）

调优的关键：Rowset

Rowset是两个步骤之间的缓存（大小可以自己设置）

如何找到性能瓶颈：观察Rowset，运行ktr文件时观察下面的窗口值（100/0表示输入100条记录，输出0条记录。如果输入远大于输出，就说明这个步骤来不及处理，就是瓶颈。）

Rowset值的设置：编辑》设置》杂项》记录集合里的记录数》10000，表示缓存里的最大记录数就是10000

其他观察方法：性能图，和步骤度量效果一样。

如何提高性能

合理增加索引

数据库查询：尽可能多的使用相等=判断来筛选数据；如果是等值查询，表就建hash索引；如果是比较查询，就建B树索引

增加复制数：查询类。多线程，2-8个线程一个步骤。具体自己调整。

加大缓存：排序类，查询类。

集群：查询类、运算类、排序

更换其他的实现方式：JavaScript、Java类

注意日志级别：Rowlevel的性能是Basic级别的1/10

.spoonrc在.kettle目录下

注意死锁问题

数据库表死锁：读写同一个表（表现是ktr在running，卡在那不动）

转换本身死锁：

这里死锁的原因：排序记录要求将所有的记录都读取到之后再排序，缓存设置10000，发完要下游处理完才能再次发送。这样以来排序需要更多数据，而表输入是复制记录到两个下游，一个要更多的数据，一个不要更多的数据。所以，死锁。

解决办法：

猜你喜欢

转载自www.cnblogs.com/lcword/p/9571063.html

Kettle优化就这么多

这么多概念……

这么多前端优化点你都记得住吗？

[转帖]原来CPU为程序性能优化做了这么多

前端框架这么多，该何去何从？

这么多响应式的模板

对于JAVA，目前只会这么多

[娱乐]内存占用这么多！

书单这么多，这份最硬核

原来，网络机架的门道也这么多

深圳为什么这么多外包人员？

APICloud为什么要扩展这么多API呢

这么多连麦方案，到底哪种适合你？

Shell——你只需要了解这么多

spring mvc 为什么这么多xml

这么多优势，何不来用云计算？

整型溢出还有这么多操作

为何学这么多技术，却做不好Coder！

为什么PCI-e比SATA快这么多？

总线--你为什么有这么多标准？

为什么会有这么多中间表？

SQL Server为啥使用了这么多内存？

什么，亏这么多还能进500强？

群聊比单聊，为什么复杂这么多？

【Mysql】改一行语句，锁这么多

前端的人真的这么多吗？

Spring Cloud微服务接口这么多怎么调试

PMP知识点这么多，如何入手？

Spring Cloud微服务接口这么多怎么调试？

原来报表可以做这么多动态交互效果

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)