公有云大脑——核心IDC简影

出差刚到家,公司最近接了一个矿场转建公有云平台的项目。

前期200台服务器作为公有云基础。

我主要负责总体网络规划、计费数据库集群设计、ceph集群自动部署、容器化设计、硬件及系统调试优化等等!

由于机房刚刚建设并且矿机都是被超过频的,直接做GPU是不行的,需要对显卡bios进行降频。

还有N多硬核问题如:硬盘坏道故障、网络拥堵,docker网桥冲突,并且在实施过程中发现有20台服务器被挖矿病毒污染了。。你敢信嘛?以及各种问题。

后续会陆陆续续更新这些问题的排查及处理方法。

老衲会开源废了九牛二虎之力设计的mysql容器集群方案以及一键部署脚本。

由于近期各种旁系项目太多,devops3.0开发进度又被耽误了。不过现在已经完成了ansible2.4+的接口集成、cmdb功能实现、接下来就是各种批量任务了。

因为有不少纯开发的同学,可能都没见过IDC机房长啥样,今天就带大家进IDC机房看看吧!

设备都是国产的1U服务器。

冷风通道,门口一个推拉门,进去后照明自动亮起。还是有点科技感觉的

当时三个服务器有问题,我就在这里调试了一下午。。相关案例细节我会在后续讲。

机柜门配有橘色氛围灯,极其暧昧:

机架式国产1U服务器

存储及其他设备

机房都是上走线了。8年前还都是下走线,下面搭个铁架龙骨,要是线有问题就得把地板块拆了,再下去顺着标签找线。唉想想都是眼泪!

当年做实施的时候拼的就是绑线的手艺。经常以为漏了几根线,全拆了重新绑。现在已经不行啦。但是看这帮小伙帮的还是不错的。

机房着火咋办?看到了,专业的灭火设备

 
 
核心机房的电源一般都是双路电,然后接UPS,并且还配备有备用发电机。
 

空调是两台互备,当年出现过空调室外机过滤网被柳絮堵了导致空调宕机,机房温度半小时内升至50多度,门把手都烫手无法进入抢修的情况。

唉!~想当年。。算了不说了。

上面只是机房一个小角落!大概就是这个样子的。

这些天熬得太厉害了,确实累了,明天整理资料和案例再给大家分享哦!

感谢各位的关注,我会持续给各位带来各个维度的技术干货。IT不易,各位互勉吧!
欢迎关注我的个人公众号,有更多的学习资料等您来拿。

猜你喜欢

转载自www.cnblogs.com/devops-ITboge/p/11012986.html