微服务架构的问题点:
1.网络原因、延迟
2.请求剧增、积压
3.线程资源无法释放等
防雪崩利器:如:A、B、C三个服务,A服务调用B服务,B服务调用C服务,这时C服务有问题,导致B服务重试,而A服务这时也得不到响应,也触发重试机制,导致A、B、C服务都不可用
1.服务降级(优先核心服务,非核心服务不可用或弱可用)
1.1 通过HystrixCommand注解指定
1.2 fallbackMethod回退函数中具体实现降级逻辑
2.服务熔断
3.依赖隔离(线程隔离)
4.监控(Hystrix Dashboard)
------------------------------------------------
默认的熔断触发要求较高,休眠时间窗较短,为了测试方便,我们可以通过配置修改熔断策略:
circuitBreaker.requestVolumeThreshold=10
circuitBreaker.sleepWindowInMilliseconds=10000
circuitBreaker.errorThresholdPercentage=50
解读:
-
requestVolumeThreshold:触发熔断的最小请求次数,默认20
-
errorThresholdPercentage:触发熔断的失败请求最小占比,默认50%
-
sleepWindowInMilliseconds:休眠时长,默认是5000毫秒
-
--------------------------------------------------------------------------------------------
-
#超时设置的原理 #如果hystrix.command.default.execution.timeout.enabled为true,则会有两个执行方法超时的配置,一个就是ribbon的ReadTimeout,一个就是熔断器hystrix的timeoutInMilliseconds, 此时谁的值小谁生效 #如果hystrix.command.default.execution.timeout.enabled为false,则熔断器不进行超时熔断,而是根据ribbon的ReadTimeout抛出的异常而熔断,也就是取决于ribbon #ribbon的ConnectTimeout,配置的是请求服务的超时时间,除非服务找不到,或者网络原因,这个时间才会生效 #ribbon还有MaxAutoRetries对当前实例的重试次数,MaxAutoRetriesNextServer对切换实例的重试次数, 如果ribbon的ReadTimeout超时,或者ConnectTimeout连接超时,会进行重试操作 #由于ribbon的重试机制,通常熔断的超时时间需要配置的比ReadTimeout长,ReadTimeout比ConnectTimeout长,否则还未重试,就熔断了 #为了确保重试机制的正常运作,(ribbonReadTimeout + ribbonConnectTimeout) * (maxAutoRetries + 1) * (maxAutoRetriesNextServer + 1); #Hystrix线程池大小 #线程数 = 每秒请求数 * 响应时长(单位s) + (缓冲线程数) #比如一台服务, 平均每秒大概收到20个请求,每个请求平均响应时长估计在500ms, #线程数 = 20 * 500 / 1000 = 10 hystrix.threadpool.default.coreSize=10 #每5秒拉取一次注册中心信息 eureka.client.registry-fetch-interval-seconds=5 #设置断路器的timeout的时间 # timeoutInMilliseconds >= ribbonTimeout = (ribbonReadTimeout + ribbonConnectTimeout) * (maxAutoRetries + 1) * (maxAutoRetriesNextServer + 1); hystrix.command.default.execution.timeout.enabled=true hystrix.command.default.execution.isolation.strategy=THREAD hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=64000 #开启重试机制 hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds: #断路器的超时时间需要大于ribbon的超时时间,不然不会触发重试 spring.cloud.loadbalancer.retry.enabled=false #请求连接的超时时间 ribbon.ConnectTimeout=2000 #请求处理的超时时间 ribbon.ReadTimeout=30000 #对所有操作请求都进行重试 ribbon.OkToRetryOnAllOperations=false #切换实例的重试次数 ribbon.MaxAutoRetriesNextServer=1 #对当前实例的重试次数 ribbon.MaxAutoRetries=0