DBA解题集:将回档时间从 14小时降低到 10分钟的方法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/linwaterbin/article/details/52336940

最近洪荒之力火了,我觉得此生能让DBA使出洪荒之力的也就是回档了。要虐哭一个游戏DBA,其实蛮简单的,让他回一次档,如果不行,就回二次。毕竟回档这事儿是件擦屁股的活,你想呀,游戏bug,开发;道具发错,产品;版本部署,业务运维;没一个省心的,感觉身体都要被掏空了。但作为DBA如果不回一两次档那跟咸鱼有啥区别呢?

​怨念了一大段的回档,光说不练假把式。听,天空一声巨响,某MMOG游戏就闪亮登场了。整个回档时间从 2016-07-19 09:40:19 开始,在2016-07-19 23:54:30结束,整个过程持续近 14 个小时,其中从远程备份系统拉取数据,占了几乎全部时间。聪明如你或许已经想到一个问题,停机时间这么长?玩家不投诉吗?你猜对了,玩家是上帝,不供着不行滴,我们在回档前了解到受影响到模块和排行榜相关,如果关闭并不影响整个游戏可玩性,所以在回档前已经协调产品发布公告,将此模块关闭:


万万没想到,一个礼拜后又双叒叕回档。要是你同学朋友中有做游戏DBA的,那请他们吃个饭吧,反正他们也去不了。当你感到憋屈,则是复盘的时候。因为在结果导向的文化下,没有增值的辛苦,都是假辛苦。

宝宝心里苦,但宝宝不说。元芳,此事你怎么看?大人,我用RTX看。深入浅出了RTX回档群,致电RD沟通,发现每次回档都涉及到排行榜模块,并且都是同一张表,该表不需要binlog做增量恢复,只要凌晨的全备。此事背后一定有一个“天大的”秘密,这就是对单表备份,本地保留 60天,异地永久。so easy ?没错,1 个月后 RD 又来说回档,可是故事到这已经结束。

俗语云,不听老人言,回档在眼前。老人家的话那可满满都是经验,大写加粗的服。腾讯内网某高P分享了一篇“从产品经理恐惧症到p4”的雄文,有图有真相:


看图说话,敲敲黑板,醒醒,画重点,今后如有升高p的可千万记住,说白了,就是持续不断地总结经验,形成方法论。这就是复盘,就是把回档时间降低 14个小时的银弹。任它回档千百遍,我以复盘应万变。当然有童鞋说这是特例,唔,我只能帮你到这。

有奇书《复盘》一本,书里提到复盘的四个步骤,即目标-结果、情景再现、得失分析和规律总结。拿着这四个步骤,去盘活每天的RTX会话,哪些做得好,哪些做得不够,把好的形成方法论;对于不好的要推敲琢磨,总结经验。谁不会复盘,谁就不会工作。成功的经验都是畸形的,复盘出来的教训才是真实的。


无复盘,不成功。


更多文章,欢迎订阅我的公众号:折剑



猜你喜欢

转载自blog.csdn.net/linwaterbin/article/details/52336940