FinOps——云成本优化的最佳实践

摘要:云计算的消费正在快速增长,但跟踪其支出却可能是其中的一个难题。进入FinOps的世界吧,这是一个旨在优化企业在云计算上支出的财务规范和技术解决方案。FinOps,可能让云不再“钱”途无量。

由于被承诺在降低成本的同时提高业务敏捷性和稳定性,CIO/CTO们纷纷将业务迁移到了云端。但租用云服务也带来了新问题,包括管理由遍布在全球的实例所生成的数千个项目组成的账单。

  \

  越来越多的企业开始求助于FinOps(财务运作),这是一种业务管理规程和分析软件,旨在计算由Amazon Web services (AWS)和Microsoft Azure等供应商提供的公共云服务的成本。该方法可以帮助企业更好地规划和预测云消费的支出需求。

  随着企业将更多核心计算功能从固定成本的数据中心迁移到可变的、基于消费的云,FinOps将变得(云专家也将其称为“成本优化”)至关重要。Gartner称,到2022年,公共云服务市场的年复合增长率将达到16.6%,届时其规模将超过3600亿美元。

  然而,在这个市场中,仍然存在着许多浪费,包括宝贵的IT预算和资源利用率。451 Research对300名金融和IT行业的领导者进行了调查,其中80%的人表示,糟糕的云财务管理对他们的业务产生了负面影响;57%的受访者每天都在担心云计算的成本管理,而69%的受访者经常超支25%。

  云计算的经济学

  Capital One云计算战略总监Bernard Golden表示,云计算不仅仅是21世纪的技术现象,更是一种由数字化转型驱动的经济模型。

  “云是新的工厂,”Golden说,他为一家在AWS上运营大部分业务的公司监管着云基础设施。Golden表示,云计算能够实现功能的自动化,并使企业能够更有效地进行运营,这与Henry Ford通过工厂生产对汽车行业进行革命性变革的做法类似。工厂生产自动化了多个流程,并以此提高了汽车的生产速度。正如Ford必须削减其机器制造汽车的成本一样,企业也必须管理它们在云软件上的支出。

  如今,大多数企业都雇佣了云战略家和董事来帮助分析和管理云资源。Joseph Daly就是一个云优化总监,他的一个重要角色就是弄清楚Nationwide应该如何在云中运行。

  Daly表示,随着全国范围内越来越多的计算资源转移到了AWS和Azure,它也遇到了优化云计算的挑战。为所需任务选择正确的云服务和实例的困难是迁移到云端的一个常见问题。Daly说,云计算的“黑匣子”也是如此,他指的是理解特定技术服务成本的挑战。AWS、微软和其他公司发布的云计算账单可能过于详细和笨拙。而Daly表示,FinOps能够帮助企业跟踪它们在CPU、内存和存储上的开销,然后进行调整,比如调整服务器的大小,以便更好地使资源与需求保持一致。

  也许最重要的是,FinOps能够帮助Daly与业务伙伴进行对话,了解在云中运行特定业务流程的成本。然后,他的同行可以以此决定如何改变流程,以减少云计算的开销。“这就是你可以开始改变运营模式的地方,”Daly说。“这将使得消费更加透明。”

  对于AutoDesk的AWS平台工程业务合作伙伴、财务经理Alex Landis来说,支出透明度显得尤为重要。他正在帮助实现一个重大转变,即通过AWS和其他云计算上的SaaS订阅来提供计算机辅助绘图软件。作为一名业务分析师,Landis正在接受培训,学习如何在云计算下处理业务。

  例如,AutoDesk已经实施了集中管理和治理策略,以防止工程师在毫无成果的云计算上浪费10万美元。

  “我最关心的是我们内部对云计算的使用情况,确保我们变得更有效率,并做一些能让我们的客户更成功的事情,”Landis说。这包括帮助企业高管理解云计算的经济性和价值。Landis表示,敲定目标和业务驱动因素是成功实施云管理的关键。

  但现实是,许多人都在匆忙中制定了自己的FinOps实践。“这是一个开放的新概念,我们正在开发最佳实践,”Landis说。

  无服务器带来了新的挑战

  将美元与AWS生成的“成本利用率报告”中消耗的服务联系起来一直是IT和财务领导者的一个难题,其中许多人发现自己需要“逆向工程”他们的账单以匹配触发的API调用所消耗的费用。

  Here Technologies的云管理和运营主管Jason Fuller表示:“然而数据摄取是如此之大,以至于你可能要处理数亿行的交易数据。”Here Technologies一直在为汽车和其他行业开发导航软件。

  但是随着云供应商越来越多地提供无服务器和功能即服务(FaaS)产品,这使得公司仅需要为运行其应用程序所执行的代码付费。这些事务通常发生在亚秒级的响应时间内,生成更多行项目的速度更快,同时也刺激着计费数据量和复杂性的大幅增加。“当你为一个新功能编写代码时,现在的服务选择是如此之快、如此之小,以至于你可以为很多人花很少的钱。但是当你开始在300毫秒内运行数十亿个东西时,它很快就会积少成多。”Fuller说。“我认为这将是一场斗争。”

  Cloudability的联合创始人J.R.Storment表示同意。该公司生产的FinOps软件可以为消费云服务的企业创建价目表。

  “我们已经看到每月的云账单文件被解压到了450GB,”Storment告诉CIO.com。“这是一家公司在一个月内基于文本的云账单。每秒计费加上SKU的爆炸式增长(AWS提供超过20万个服务SKU),以及大型企业对公共云的广泛采用,每年可以达到9位数,已经创造了大量数据。”

  为了帮助整理FinOps实践,Cloudbility与Nationwide、AutoDesk、Here Technologies等公司联合成立了FinOps基金会(F2),这是一个专注于推广云财务管理最佳实践和标准的非盈利行业协会。

  不管企业是在遵循F2的指导方针还是自己设计的最佳实践,Capital One的Golden表示,管理云计算支出有以下几个关键策略:

  •   决定谁在什么上产生了花费。要做到这一点,您需要“标记”您的资源,或者找出应用程序访问了哪些资源。这在成千上万人访问着数百个应用程序的企业中尤为重要。
  •   修剪树篱的时候不要用割草机。对于所需的计算工作负载,您是否拥有正确的EC2实例,或者您是否过度进行了配置?确保只使用并支付您实际需要的费用。
  •   构建适合云计算的应用程序。如果你是一个高交易量的企业,这意味着你的应用程序需要横向扩展,允许你根据需要添加或删除资源。

  “这些都是围绕成本管理的行业最佳实践,”Golden说。至于寻找合适的人选来担任云战略总监或成本优化主管,Golden说你应该去寻找擅长将业务需求应用于企业需要的人。“事实上,你也找不到拥有10年管理云成本经验的人。”

进入21世纪以来,伴随着互联网和移动互联网的蓬勃兴起,IT技术的发展可以用瞬息万变来形容。随着越来越多的组织开始把IT基础设施从传统内部部署迁移到公有云,亦或者采用了私有云和混合云的部署方案,关于什么是云,为什么需要云,如何实现云化迁移已无需多谈。我们已在上云的过程中熟悉了DevOps的概念,并看到其在软件开发、技术运营和质量保障三者紧密协同上带来的成效。DevOps是业务研发和业务运营的结合,那么如果业务成本也要跟业务运营结合呢?这就是FinOps。今天,咱们就聊聊关于成本——“钱”的事儿。

云的副作用

首先还是要肯定一下在操作层面(Ops),云所具有的巨大优势。在传统本地物理环境下,IT设备采购和部署的周期冗长,一般以数周乃至数月计,且一旦采购和部署完毕,再想进行资源配置变更将变得非常困难。迁移到云环境后,采购和部署十分敏捷,以分钟计,并可以在任意时刻迅速地完成资源配置变更,也就是我们常说的“按需使用”。

那么在财务层面(Fin)呢?传统本地物理环境下,采购成本由财务部门统一管理,成本开销清晰,且设备价格固定、透明,易于成本控制和管理。反观云端,“按需使用”使采购(或者叫订购、消费更为合适)分散到各个使用部门,很难预测基础设施的确切成本,且按需计费的模式实时产生费用,导致价格时刻变化,这些都使成本管控的难度激增。云的副作用出现了!

从一份调研报告中,我们可以一窥云端资源成本管理的现状:

80%的受访者表示糟糕的云资源成本管理对他们的业务产生了负面影响;

85%的受访者表示云成本支出超出了他们的预算;

57%的受访者表示每天都会忧虑云资源的成本管理;

63%的受访者表示超过60%的采购量都没有考虑优化的采购方案;

40%的IaaS实例配置的资源超过了所需的工作负载。

问题出在哪儿了?公有云提供商在向我们推销时不是说好的”在需要时获得所需产品的服务,只为你真正需要的买单“吗?

消费和账单是两码事

正如前面分析过的,云打破了传统的IT采购模式。通常情况是财务一次性地将一笔预算充值到组织的云账号中,消费则是使用部门在需要云资源的时候实时发生的,这意味着真正的消费阶段是发生在使用部门而非传统的采购部门,即使用部门直接购买所需。更有甚者,比如AWS是消费后付款,即使云账号中没有任何余额也会持续发生消费,直到下个月一张长长的消费账单摆在了财务的面前……结账!

这时关注成本的人会忍不住提出质疑了,“这些资源到底要花多少钱?如果我们的业务激增、用户数倍增加,又该花多少钱?”这些问题是合理的,尤其是在你销售SaaS服务时,你需要了解每位用户的费用,才能对其进行调整。直接采用官方提供的云成本参考价进行建模,可以实现此目标。但是如果你提供的服务中某些资源需求并不是受你控制的,而是由用户决定的呢?比如云存储的成本。想象一下你能要求用户按存储使用情况付费吗?有些时候,这并不是解决方案,通常对控制成本没有帮助。

或许你也遇到过同样的场景,在同时使用包年付费的云资源和按需付费的云资源时,某个月支出了大量的费用购买包年的资源,而在后续的整个包年期间,这些费用都不再出现在月账单中了,账单中只有当月按需付费的成本。但是实际上从业务成本角度,无论是包年还是按需付费的成本都是对于IT资源的需求。因此如果仅就财务成本支出的报表来看,是无法体现业务对IT资源的真实需求。无法体现真实需求就意味着无法做出快速有效的调整,这些调整包含了降配或者升配。

在云盛行的今天,资源消费数据每时每刻都在生成,你总不能还是每个月甚至到了年底通过查看采购合同或订单才知道自己在IT上的开销吧?随着组织将更多核心IT基础设施从固定成本的数据中心迁移到可变的、基于需求而消费的云资源环境里,一个新的理念——FinOps变得至关重要。

FinOps是文化上的转变

先来看一下FinOps基金会对FinOps的定义:

FinOps is the operating model for the cloud. FinOps enables a shift — a combination of systems, best practices and culture — to increase an organization’s ability to understand cloud costs and make tradeoffs. In the same way that DevOps revolutionized development by breaking down silos and increasing agility, FinOps increases the business value of cloud by bringing together technology, business and finance professionals with a new set of processes.

FinOps是将DevOps、财务和业务整合在一起的变革,其目标在于优化一个组织在云计算上的支出的财务规范和技术解决方案,即根据支出的历史记录和来自预期负载的信息,FinOps可以在需要时预分配资源或估算成本。FinOps可以称为“财务运营” ,或者更直白地称为“成本优化”,是将财务问责制引入云的IT支持,进行调整以优化质量和支出。

云的支出规则其实很简单,付你所需。但是问题在于首先要清楚你需要什么?一支优秀的FinOps团队首先就是要通过多云平台全面了解云资源的成本分布以实现成本控制,将钱花在真正需要的地方并重新分配资源。通过实时数据和统计信息,FinOps团队可以估算未来需求,并根据在云资源成本上的支出做出及时的决策,进而预分配资源或进行折扣商定。只有通过财务、业务、IT、运营支撑的整合与合作,才能确保预算更加准确,实现成本优化,避免资金浪费。所以说,FinOps是一个文化上的转变,需要建立新流程和新组织来达到成本管理的目标。

云资源成本优化的工具

“工欲善其事必先利其器”,当我们理解了FinOps对于一个组织在云端资源成本管理上的价值后,很自然地希望通过工具来助力目标的达成。

通过对需求的梳理,我们可以归纳出云资源成本优化工具的几方面能力:

分析成本趋势

从资源类型、时间、云服务商等不同视角查看成本;

通过均摊成本概念,将云资源花费的财务账单转换为IT视角的成本账单;

账户余额降低到阈值以下可触发多通道告警(站内信、邮件、企业微信机器人等);

月度消费预测。

成本优化建议

多维度自定义规则组,涵盖主机、磁盘、内存、网络各方面;

根据规则组持续监控,自动列出云资源优化建议;

预测采取优化措施后节省的成本总额。

连接财务(Fin)和IT(Ops)

自动发送日报、周报、月报给相关人员,多团队协作以确保无浪费地使用云资源;

内置多云比价平台,帮助寻找性价比最高的公有云服务商。

这里给大家介绍两款国外的云资源成本优化工具或平台,感兴趣的朋友可以进一步了解。

这些国外的工具或平台所对应支持的公有云基本上只有AWS,Azure,Google Cloud三家,尽管国内的阿里云逐渐也被支持,但是对于国内更多的公有云服务商而言,比如排名前列的腾讯云、华为云、金山云等,还远远未被支持。

基于FinOps理念,云和恩墨推出了Cloudarrow(穿云箭)平台(目前云上成本监控和核算优化的厂商国内还很少,再次只列举该平台),优先对接支持了国内最流行的阿里云、华为云和腾讯云,可为您提供“一站式”的多云管理方案。Cloudarrow完全具备了上述云资源成本优化的三方面能力,且完全基于公有云服务商的公开API对云资源使用情况进行监控,无需安装任何插件或者客户端,对云主机无额外负载。这个平台经过一年多时间的积累和打磨,已经在云和恩墨组织内部使用,并在2019年为组织节省了超过20%的云资源成本投入。要知道,这一节省比例是会随着组织规模和云资源使用规模的增长而大幅提高的。

鉴于系统中所有的资产、成本、云账号等数据资源都依附于团队而存在,我们在穿云箭中引入了团队管理的概念,实现对人员、规则、账号进行统一管理与设置;同时,资源在团队范围内处于共享状态,团队中任何成员均可以访问到这些资源。

        资源的访问依赖于云账号,它是穿云箭平台中对接公有云的基本访问凭证,一般使用AccessKey、访问密钥进行认证。您可以选择团队后进行云账号的添加。当然,为保障客户数据安全,我们采取了高等级的安全手段,包括数据多重多地备份,确保不因突发事件而丢失,并采用密钥加密机制对云账号、密码等核心数据进行保护。

        经过一系列配置后,现在您可以轻松查看您的团队在多云环境下云服务器、云硬盘等资产的情况了。通过资产分析和费用对比可以轻松了解多云环境下的费用支出详情,为IT部门提供成本分析与优化建议。

那么现在问题来了?你和你的组织需要FinOps吗?

(木有经历传统运维到devops运维然后再到AIOPS运维时代的团队和人不知道里面的流程和痛点)

猜你喜欢

转载自blog.csdn.net/english0523/article/details/111587883