初创的云平台公司是否需要设立运维岗

公司的云平台准备上线了,一般会遇到一个问题:研发团队会继续新的功能的开发,已经运行的云平台就置于无人看管的境地,这似乎是个隐患。

所以运维工作岗闪亮登场了。

岗位职责

  • 云产品的交付验收
  • 云产品的配置管理
  • 云产品的上线与升级
  • 上线云产品的运维管理
  • 上线云产品的性能调优
  • 上线云产品的安全检查以及缺陷修补

岗位工作量
运维工作的工作量可以从两个方面进行分析。

一个是运维产品的复杂度和量级。如果产品复杂,例如使用场景是物联网云-端-App场景,从App上反馈出来的问题,可能出在端上,也可能出在云上,定位与解决一个问题的复杂度就较高,可能支出的时间和精力会较大。量级是另外一个需要考虑的问题,如果系统中已经存在的数据越多,那么对应的工作量就越大。以影响数据格式的功能变更为例,在没有数据的时候,开发工程师直接在开发时就改了,可是有数据的,尤其是已经上线的平台,除了遵循一定的升级顺序,还应该对数据进行相应的修改,而即使是只涉及到一个字段的修改,在只有几十K数据和几十B数据还是有显著不同。

另外一个方面是运维是否要开发。如果要提高以后维护的效率,应该将运维的过程适当自动化,那么运维是需要进行开发的。开发运维功能,在早期的工作量会较大,即使没有多少业务数据。但是在后期往往能获得持续的好处,并能将运维工作量控制在较小的范围,因为运维自动化了以后,可以不受数据量级的影响。

如果不开发运维功能,可能的风险是:突发的数据增多,导致运维工作暴增,进而影响客户体验和产品功能的演进。这也是我建议初创的云平台团队应该尽快地配置一个会开发的运维的原因。

岗位特点
一般来说,运维工作的目标是保障99.99%的服务质量,也就是包括升级等维护操作在内的,服务中断时间要小于万分之一,这也包括了节假日和周末。

因此,运维岗倾向于一个全天候的工作岗位,如果向导演推荐一个运维岗角色,我会建议它是一个脚本达人,小段脚本就能把事件摆平,平时看上去很悠闲,似乎不怎么工作,不过不管是春节还是双11,他们都时刻在后台为产品保驾护航。对于这样的岗位,当然不能用通常的工作日为单位的考察方式来考核了。

猜你喜欢

转载自blog.csdn.net/lihongzhai/article/details/73303056