降级保护
服务降级通常是针对非核心业务在业务流量激增情况下一种服务策略,通过服务降级可以保证核心业务的顺利进行。如果是主动降级,通常会返回一个默认值,被动降级是指当发现异常时,为了控制异常的影响范围而触发的自动服务降级。
降级分类
● 超时降级:配置好超时时间和超时重试次数,并使用异步机制探测恢复情况。
● 失败次数降级:主要针对一些不稳定的API,当失败调用次数达到一定阈值时自动降级,同样要使用异步机制探测恢复情况。
● 故障降级:比如要调用的远程服务“挂”了(网络故障、DNS故障、HTTP服务返回错误的状态码、RPC服务抛出异常),系统可以直接降级。降级后的处理方案有:采用默认值(比如库存服务“挂”了,返回默认现货)、兜底数据(比如广告服务“挂”了,返回提前准备好的一些静态页面)、缓存(使用之前暂存的一些数据)。
● 限流降级:在高并发或者秒杀场景中,系统可能会因为访问量太大而导致崩溃,此时开发者会使用限流机制来限制访问量,当达到限流阈值后,后续请求会被降级。
降级与熔断的区别
降级和熔断这两个概念很容易被等同,它们最终达到的效果都是保护系统,都是为防止系统整体崩溃采用的技术手段。从用户体验的角度看,二者也有相似之处,都是某些功能暂时丧失可用性。但是,二者之间还是存在明显的差别的,具体如下:
● 触发条件的差别。熔断通常是自动触发的,而降级除了异常情况下的熔断,也可以根据程序中预先设置的代码逻辑进行手动降级。
● 分级的差别。熔断通常依赖一个系统中的整体的框架处理逻辑,每个微服务都需要无差别地具备熔断的特性,而降级则需要针对业务的优先级和重要性进行分级。对于核心业务,一般设置的级别较高;而对于核心系统下游的非核心业务,如果是弱依赖关系,那么级别可以相对降低,但是如果它们具有强依赖关系,那么非核心业务此时也会升级为核心业务。在下图中,网关系统处于调用链路的入口,优先级高;
数据分析、服务监控都是旁路系统,属于辅助性功能,相对优先级较低。
下面总结一下Spring Cloud中两种简单的实现服务降级的方法。
● 在FeignClient中实现服务降级:
● 在Hystrix中一般使用fallbackMethod实现服务降级: