谈一谈分布式架构的相关重要概念(RPC、高并发高可用、限流、熔断、负载均衡)

第一章 分布式概念

1.1 什么是分布式

  1. 《分布式系统原理与范型》定义:“分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统”。
  2. 分布式系统(distributed system)是建立在网络之上的软件系统。

1.2 分布式与集群的关系

  1. 集群指的是将几台服务器集中在一起,实现同一业务。
  2. 分布式中的每一个服务节点,都可以做集群。 而集群并不一定就是分布式的。
  3. 分布式主要是体现在服务之间存在通信(调用),而集群部署的应用是用来水平扩展的,为同一业务逻辑,不存在通信。可以理解为在分布式系统中,出现的是集群与集群之间的远程调用(如用户模块集群调用支付模块集群)

每一个节点都必须要做集群

1.3 软件架构演变 

单一应用架构

当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本。此时,用于简化增删改查工作量的数据访问框架(ORM)是关键

垂直应用架构

当访问量逐渐增大,单一应用增加机器带来的加速度越来越小,将应用拆成互不相干的几个应用,以提升效率。此时,用于加速前端页面开发的Web框架(MVC)是关键

分布式服务架构

当垂直应用越来越多,应用之间交互不可避免,将核心业务抽取出来,作为独立的服务,逐渐形成稳定的服务中心,使前端应用能更快速的响应多变的市场需求。此时,用于提高业务复用及整合的分布式服务框架(RPC)是关键

流动计算架构

当服务越来越多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增加一个调度中心基于访问压力实时管理集群容量,提高集群利用率。此时,用于提高机器利用率的资源调度和治理中心(SOA)是关键

 

1.4 RPC是什么

RPC【Remote Procedure Call】是指远程过程调用,是一种进程间通信方式,他是一种技术的思想,而不是规范。

它允许程序调用另一个地址空间(通常是共享网络的另一台机器上)的过程或函数,而不用程序员显式编码这个远程调用的细节。

即程序员无论是调用本地的还是远程的函数,本质上编写的调用代码基本相同。

  1. 他来解决分布式系统的各个服务之间互相交互问题
  2. RPC思想原理

 rpc远程过程调用是通过stub代理来实现的,一图胜千言,看下图即明白服务之间的调用是如何进行的。

3.服务之间的交互可以用两种方式

1)RPC远程过程调用,dubbo框架可实现,底层封装了Socket网络编程+自定义序列化数据。

2)RestAPI (严格来说,SpringCloud是属于Rest方式进行服务之间的交互,不属于RPC)

底层为http通信  + json传递数据。

第二章 分布式思想与基本概念

2.1 高并发

2.1.1 通过设计保证系统可以并行处理很多请求。   

        应对大量流量请求

2.1.2 高并发衡量指标

  1. 响应时间(RT)

系统对请求做出响应的时间,即一个http请求返回所用的时间

     2.吞吐量

系统在单位时间内处理请求的数量  与服务器的性能有关

    3.QPS(Query/Request Per Second)TPS(Transaction Per Second)

每秒查询(请求)数、每秒事务数

专业的测试工具(压力测试):Apache ab、Apache JMeter

    4.并发用户数(同时)

指系统可以同时承载的正常使用系统功能的用户的数量

2.2 高可用

2.2.1 服务集群部署

2.2.2数据库主从+双机热备

双机热备特指基于高可用系统中的两台服务器的热备(或高可用),因两机高可用在国内使用较多,故得名双机热备,双机高可用按工作中的切换方式分为:

-备方式(Active-Standby方式)

主-备方式即指的是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器处于该业务的备用状态(即Standby状态)。

双主机方式(Active-Active方式)

双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active状态)

2.3 注册中心

保存某个服务所在地址等信息,方便调用者实时获取其他服务信息(Zookeeper)

  1. 服务注册指的是服务的提供者(被调用者)注册到注册中心
  2. 服务发现指的是服务消费者(调用者)的行为

2.4 负载均衡

 动态将请求派发给比较闲的服务器。(Nginx)

负载均衡的策略:轮询、加权轮询、随机Random、Hash、最小连接数LC、最短响应时间LRT。

2.5 服务雪崩

服务之间复杂调用,一个服务不可用,导致整个系统受影响不可用

调用链

当调用链越来越长,只要其中的某一个服务不可用,整条服务链都不可用,这叫服务雪崩。

2.6 熔断

某个服务频繁超时,直接将其短路,快速返回mock(模拟/虚拟)值

说白了,发生服务雪崩的时候,为了保证系统的正常使用,在不可用服务上加一个熔断器,就算这个服务除了故障,无法真唱返回数据,我们也可以返回一个兜底数据,至少保证这个服务链是可用的。

2.7 限流

限制某个服务每秒的调用本服务的频率

防止Ddos恶意攻击,可用一个过滤器过滤所有请求,一个用户在一秒内只能有一次请求被放行,保证服务器不被恶意爬虫攻击。

2.8 API网关

请求我们的服务时,必须要经过服务器的网关才能到达我们的服务。

API网关要做很多工作,它作为一个系统的后端总入口,承载着所有服务的组合路由转换等工作,除此之外,我们一般也会把安全,限流,缓存,日志,监控,重试,熔断等放到 API 网关来做

2.9 服务跟踪

追踪服务的调用链,记录整个系统执行请求过程。如:请求响应时间,判断链中的哪些服务属于慢服务(可能存在问题,需要改善)。

2.10 弹性云

  1. Elastic Compute Service(ECS)弹性计算服务
  2. 动态扩容,压榨服务器闲时能力
  3. 例如:双11,618,高峰时多配置些服务器,平时减少多余的服务器配置(用于其他服务应用),避免资源浪费
发布了227 篇原创文章 · 获赞 77 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/m2606707610/article/details/104114222