kettle 十分钟百万数据迁移 - 代码天地

kettle 十分钟百万数据迁移

企业开发 2023-07-12 04:20:02 阅读次数: 0

现在需要对以往数据进行整合并进行数据迁移

确定目标表

数据源及数据量如下

原始待迁移数据 — 待迁移数据

目标表与 Z0_工单_整理备份的字段是一致的。为了方便后续操作（增删改查、数据迁移、增量备份）需要新增几个字段

1、 id 作为主键，方便更新、删除等修改操作
2、 inserTime 数据插入时间，记录更新频次
3、 updateTime 时间戳，记录最近一次更改时间，方便后期数据迁移、增量备份
4、 source 数据来源，方便后期数据溯源及数据维护

确定好目标表字段后将原始表内的字段进行一一对应。

字段映射

1、字段分类

保留字段，不对字段做任何修改保留字段名称
更名字段，保留字段内容，但要对字段名称进行修改
删除字段，目前业务不再需要字段，删除

2、字段类型及干扰数据

数据由于历史问题，可能存在不规范的情况。
比如：时间格式内存在汉字；字符串编码格式与当前不一致。

解决思路：

将所有字段按照字符串进行迁移（使得数据量变大，但可以保证数据平稳迁移，迁移后需要对不规范数据进行修改）
进行错误处理，如果量不大，可手工将数据入库。
提前设置编码格式，ETL当中规范数据值类型（解决方式截图如下）

优化

1、数据库引擎优化

更改存储引擎InnoDB-》MyISAM，数据插入速度提升一倍，亲测有效

2、查询优化

useServerPrepStmts=true
cachePrepStmts=true

SQL SERVER查询优化

3、插入优化

MYSQL 插入优化

KETTLE 表输入优化

4、JVM 优化

根据本地计算机硬件情况，分配JVM内存，我本地是16G

KETTLE SPOON.BAT 优化

5、灵性优化

找个没人操作数据库的时段，很重要，效率提升超级明显。

结果展示

236w 数据不到十分钟迁移完毕，硬件再好点速度会更快。奈何本地条件有限

结果展示

猜你喜欢

转载自blog.csdn.net/weixin_41160534/article/details/104048284

kettle 十分钟百万数据迁移

【kettle】10分钟搞定kettle源码部署

kettle数据迁移

oracle查询十分钟之前的数据

十分钟pandas

课间十分钟

【Kettle】kettle增量同步变动数据

kettle教程：spoon kettle数据转换示例

Kettle数据迁移的安装及使用

kettle分页迁移数据

kettle hive 导入数据

Kettle增量同步数据

kettle spoon 数据同步

Kettle数据转换

异构数据的同步——kettle

Kettle 抽取数据举例

kettle 从mongo抽取数据

KETTLE数据上传

KETTLE——（二）数据抽取

【数据挖掘】Kettle初探

kettle 同步表数据

什么是ETL、Kettle，Kettle数据迁移、常用ETL工具

Kettle

【kettle】

阿里云迁移后服务器十分钟一卡

2019 宝塔十分钟迁移网站预览一遍流程

10分钟搞定kettle源码部署

kettle案例-kettle分库分表导入数据

MongoDB数据迁移之迁移工具Kettle

十分钟学会 Fiddler

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)