程序员必须知道导致程序崩溃的情况。

发生事情的背景：
1.在代码开发过程中，有的时候我们会在源代码中添加一些调试代码和信息打印，因为想看看程序执行到这个点会发生些什么。（每次出现这种情况的时候，我建议你想想是否添加一个单元测试用例会更有意义？）调试完就没用的代码，通常没有必要留着。但有的时候，我们仍会留下一些日志打印，以便出现问题时可以更好地进行诊断。

2.在C++代码中可以通过条件编译来防止调试代码影响到生产环境，我们也可以通过日志级别来控制调试信息的输出。不过由于疏忽，有时我们仍然可以在生产环境的日志里看到开发人员留下的古怪信息，如果不小心让用户看到就麻烦了。

下面我要来分享的是一件工作中碰到的一个真实案例，仅一条额外的调试信息就能让服务器崩溃。

1.为了增加可测性，我们对服务器以及客户端的的代码做了一些重构，包括Makefile。一不小心，在release配置里打开了一个debug flag，也没人发现，导致在生产环境中会多输出一条调试日志。就多了一条日志本来也没什么关系，可是这条日志会打印某个指针指向的数据，而在某个罕见情况下这个指针居然会是空指针。而且因为是调试信息嘛，就没对指针有效性进行检查，这样就导致了Segmentation Fault，服务器活客户端的进程crash。

可是为什么我们在打开了debug flag的测试环境以及日常开发环境中都没有发现这个问题呢？原来在测试环境中测试数据覆盖不够，只有在生产环境中大量玩家实际进行游戏才能触发这个小概率事件…

所以最后我总结和复盘了这事情：还是要加强代码评审和增加测试覆盖度，做好基础工作，因为再小的错误都能引发血案，防不胜防。

更多安全技术文章，请关注 “游戏安全攻防” 公众号，一起学习，一起进步。

程序员必须知道导致程序崩溃的情况。

猜你喜欢