云上安全设计一
工作负载安全
- 持续监控和消除云工作负载中的威胁,保障云工作负载安全
- 防护产品
- 企业主机安全HSS
- 容器安全服务CGS
- 云堡垒机CBH
网络安全
- 通过网络层安全服务配置,实现云上资源隔离、网路边界防护等
- 防护产品
- 云防火墙CFW
- DDos高防服务器AAD
应用安全
- 通过应用层安全服务配置,拦截应用层攻击,保护应用服务安全
- 防护产品
- Web应用防火墙WAF
- 应用信任中心ATC
数据安全
- 对数据资产进行全声明周期管理,保证数据使用全流程安全可视、可控、可溯
- 防护产品
- 数据安全中心DSC
- 数据加密服务DEW
- 数据库安全DB SS
- 云证书管理CC M
安全管理
- 对云上环境进行管理,尽可能降低云上环境的风险,保证云上安全
- 防护产品
- 统一身份认证IAM
- 威胁检测服务MTD
- 管理检测与响应MDR
- 安全运营中心SOC
- 态势感知SA
- 合规治理云图Compass
云上安全设计二
安全通信网络
- DDoS类攻击使用DDoS防护
- Web类攻击采用WAF防护
- 采用SSL证书进行通信加密
安全区域边界
- 互联网边界、VPC之间采用云防火墙
安全计算环境
- 主机安全服务、容器安全服务;
- VPC内访问控制使用网络ACL+安全组;
- 数据安全中心实现数据全生命周期安全管理;
- 存储默认启用数据加密;
- 关键数据库部署DBSS数据库安全服务。
安全管理中心
- 通过态势感知服务保障云上资源安全;
- 漏扫定时扫描云上各资源漏洞;
- 使用云日志、云审计、云监控管理云上资源;
- 堡垒机接入运维。
可用性设计的意义
不同SLA级别对应的停机时间如下表所示
SLA | 每周故障时间 | 每月故障时间 | 每年故障时间 |
---|---|---|---|
99% | 1.68小时 | 7.2小时 | 3.65天 |
99.90% | 10.1分钟 | 43.2分钟 | 8.76小时 |
99.95% | 5分钟 | 21.6分钟 | 4.38小时 |
99.99% | 1.01分钟 | 4.32分钟 | 52.56分钟 |
99.999% | 6秒 | 25.9秒 | 5.26分钟 |
- 全年停机5.26分钟才只能做到5个9,即99.999%。以此类推,想要达到六个9甚至更多9。
- 对系统的要求性非常高,所以系统的可用性也并非越高越好
:::warning
越高的可用性,越低的宕机可能,越良好的用户体验,但同时意味着更高的系统要求,更昂贵的建设成本。
可用性与业务需求强相关,业务的重要性,决定了设置可用性到哪一程度。
:::
- 对系统的要求性非常高,所以系统的可用性也并非越高越好
云上可用性设计
数据备份
- 为数据设计备份,备份是数据防丢的基础
高可用/容灾
常见的云上系统高可用设计方案
- 本地高可用方案:用于本地生产中心,单Az的场景下的高可用设计。
- 同城高可用、容灾方案:用于同城容灾中心,双Az场景下的高可用设计,包括双活数据中心解决方案,主备容灾解决方案。
- 异地高可用/容灾方案:用于异地容灾中心,跨region场景下的高可用设计,包括两地三中心容灾解决方案,主备容灾解决方案。
云上性能设计
性能设计的意义
- 预防性能瓶颈:
- 提早发现解决性能问题:服务器CPU/MEM利用率高、程序内存泄漏、应用访问链路网络拥塞、数据库连接池不足、应用进程挂死、缓存命中率低。
- 提升用户体验:
- 提前改善用户体验,防止:网页无法打开或缓慢、视频卡顿、花屏、行情刷新不及时、游戏掉线、卡顿。
- 合理分配资源
- 根据性能指标合理分配资源:云服务资源规格。 集群节点数量等有针对性资源扩容、缩容管理。
设计一
云上应用的性能,受影响的因素有很多,有数据路径上和软硬件上所发生的事情都包括在内,因为这些都有可能影响性能,这使得性能评估变得异常复杂。
影响云上应用性能的因素主要是延时、吞吐量、IOPS,并发能力与计算资源,网络资料,存储资源,数据库资源相关
计算资源:共享大型基础架构,意味着会存在资源竞争,如何将有限的资源合理分配出去,能够平衡各种负载的变化性
- 计算资源会影响到应用的延时性能因素
网络资源:公有云基础架构处于企业数据中心之外的特性决定了它必须利用广域网,因而会引入带宽和延迟问题。多对等网络、加密卸载和压缩是设计过程中必须考虑的因素
网络资源是影响应用的吞吐量因素之一
存储资源:不同性能特征的存储产品的读写性能,不可测的弹性块存储的磁盘I/O
存储资源会影响到应用数据传输能力的性能因素
数据库资源:如果应用程序使用了数据库,数据库资源的能力是影响应用程序并发能力的性能因素
云基础架构有可能产生不可预测的性能表现。变化多端的各种负载可影响可用的CPU、网络和磁盘I/O资源,导致同时工作的应用程序的性能表现不可预测
设计二
架构体系的整体设计同样重要。ex:避免数据异地传递,将资源部署在就近业务点,选取CDN服务产品等。可以有效减少访问延迟
设计三
云上可扩展性
可扩展性设计的意义
可扩展性是一种对软件系统计算处理能力的设计指标,高可扩展性代表一种弹性,在系统扩展成长过程中,软件能够保证旺盛的生命力,通过很少的改动甚至只是硬件设备的添置,就能实现整个系统处理能力的线性增长,实现高吞吐量和低延迟高性能
水平扩展: 也称为横向扩展,指能够连接多个软硬件的特性,这样可以将多个服务器从逻辑上看成一个实体。当系统通过添加具有相同功能的新节点扩展时系统可以水平扩展,从而在所有节点之间重新分配负载。系统和服务器通过向负载均衡网络添加更多服务器来扩展,以便传入的请求可以在所有这些网络之间分配。
垂直扩展:当一个现有IT资源被具有更大或更小容量的资源所代替,则为垂直扩展。也就是对当前服务器的CPU性能等进行原地的扩大和缩小,当系统通过向节点添加处理器,主存,存储或网络接口进行扩展时,系统可以垂直或向上扩展,以满足每个系统更多的请求。通过增加处理器数量或主存来扩展,以在托管更多的虚拟服务器
云计算的可扩展性使用户能够随着负载的增加而扩大资源消耗,开发人员创建可扩展架构。
例如,微服务和基于容器的体系结构自然会鼓励独立扩展。
延迟和吞吐量是衡量可扩展性的一对指标,我们希望获得低延迟和高吞吐量的系统架构。所谓低延迟,也就是用户能感受到的系统响应时间,比如一个网页在几秒内打开越短表示延迟越低,而吞吐量表示同时有多少用户能够享受到这种低延迟,如果并发用户量很大时,用户感觉网页的打开速度很慢,这意味着系统架构的吞吐量有待提高
设计一
设计二
成本设计
成本设计的意义
设计一
- 按需计费:应对需求波动、灵活弹性扩容、开发/测试环境。
- 包年/包月:资源需求稳定、长期使用优惠。
设计二
- 华为云提供预算、账单等功能,可视化资费管理,帮助客户实现成本优化
- 流水账单:包括每一笔订单和每个计费周期(云服务计费周期包含每小时结算、每天结算、每月结算)的账单信息。
术语和缩略语
参考学习资料
https://connect.huaweicloud.com/courses/learn/Learning/sp:cloudEdu_?courseNo=course-v1:HuaweiX+CBUCNXCX050+Self-paced&courseType=1