tidb使用过程中遇到问题汇总

本文内容是马上消费金融DBA团队使用tidb遇到的问题汇总.李银龙主负责整理.
问题一: tidb与mk-table-checksum不兼容
描述: 在gh-ost与syncer兼容性测试时,做一致性校验时,发现tidb与mk-table-checksum不兼容,执行就报错。

问题二: syncer skip delete不生效
描述: syncer在配置多表聚合同步skip delete不生效问题。官方已经修复这个问题。

问题三: syncer异常退出
描述: syncer配置跳过ddl时,syncer运行一段时间crash的问题。 官方已经修复这个问题。

问题四: mysql客户端crash
描述:当使用tidb的use <dbname>时(该db表达到100张以上),mysql客户端crash事项。官方已经把这个bug修复。https://github.com/pingcap/tidb/issues/6622

问题五: loader聚合加载的异常
描述: loader在聚合加载时,即便没有配置聚合加载的表仍然会被聚合加载进TIDB。官方已经修复这个问题。

问题六: 必须要配置跳过所有ddl操作的坑
描述: syncer在多主mysql做sharding聚合到TIDB的场景下,必须要配置跳过所有ddl操作的坑。

问题七: TIDB 2.0.4的bug
描述: 长亮账务TIDB系统升级到tidb 2.0.4后,syncer同步到 497004599181314 这一条记录时,就报错了。TIDB降级到2.0.3,并删除这一条记录重启syncer时,就好了。

问题八: 统计信息自动收集不及时
描述: 虚拟卡集群上线后,出现过若干次tidb的统计信息不准导致执行计划出错,业务受严重影响的case(甚至出现一个oltp sql执行中报gc错误的问题)。我们尝试在凌晨进行全库表analyze,这个问题仍然间歇性出现。

问题九: 长亮账务TIDB集群少了一条记录
描述: 业务方在使用TIDB对账时发现,始终对不上,最终发现TIDB少了一条记录。

问题十: TIKV故障自恢复时间比预估长
描述: 在对虚拟卡TIKV进行容灾演练时(单机4 tikv实例),模拟某一服务器故障时,业务请求失败持续了38秒。启动该服务器所有tikv实例时,业务请求失败持续了54秒。比预估的30s长。

业务场景中重要且难满足的一个需求: 冷热数据隔离问题
描述: 如果要把现网的mysql替换成TIDB,OLTP、数仓抽数等业务场景都会直接使用TIDB,而TIDB本身没有冷热数据隔离功能,抽数时,必然会对OLTP业务有影响(晚上抽数也可能有业务在运行)。

猜你喜欢

转载自blog.51cto.com/songhl/2159899