Circuit Breaker - Hystrix
- Latency Tolerance and Fault Tolerance for Distributed Systems
Hystrix 적용하기
@HystrixCommand public String anyMethodWithExternalDependency() { URI uri = URI.create("http://172.32.1.22:8090/recommended"); String result = this.restTemplate.getForObject(uri, String.class); return result; }
- 위의 메소드를 호출할 때 벌어지는 일
- 이 메소드 호출을 'Intercept' 하여 '대신' 실행
- 실행된 결과의 성공 / 실패 (Exception) 여부를 기록하고 '통계'를 낸다.
- 실행 결과 '통계'에 따라 Circuit Open 여부를 판단하고 필요한 '조치'를 취한다.
Hystrix - Circuit Breaker
- Circuit Open
- Circuit이 오픈된 Method는 (주어진 시간동안) 호출이 '제한'되며, '즉시' 에러를 반환한다.
- Why ?
- 특정 메소드에서의 지연 (주로 외부 연동에서의 지연)이 시스템 전체의 Resource 를 (Thread, Memory등)를 모두 소모하여 시스템 전체의 장애를 유발한다.
- 특정 외부 시스템에서 계속 에러를 발생 시킨다면, 지속적인 호출이 에러 상황을 더 욱 악화 시킨다.
- So !
- 장애를 유발하는 (외부) 시스템에 대한 연동을 조기에 차단 (Fail Fast) 시킴으로서 나의 시스템을 보호한다.
- 기본 설정
- 10초동안 20개 이상의 호출이 발생 했을때 50% 이상의 호출에서 에러가 발생하 면 Circuit Open
- Circuit이 오픈된 경우의 에러 처리는 ? - Fallback
- Fallback method는 Circuit이 오픈된 경우 혹은 Exception이 발생한 경우 대신 호출될 Method.
- 장애 발생시 Exception 대신 응답할 Default 구현을 넣는다.
@HystrixCommand(commandKey = "ExtDep1", fallbackMethod="recommendFallback") public String anyMethodWithExternalDependency1() { URI uri = URI.create("http://172.32.1.22:8090/recommended"); String result = this.restTemplate.getForObject(uri, String.class); return result; } public String recommendFallback() { return "No recommend available"; }
- 오랫동안 응답이 없는 메소드에 대한 처리 방법은 ? - Timeout
@HystrixCommand(commandKey = "ExtDep1", fallbackMethod="recommendFallback", commandProperties = { @HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "500") }) public String anyMethodWithExternalDependency1() { URI uri = URI.create("http://172.32.1.22:8090/recommended"); String result = this.restTemplate.getForObject(uri, String.class); return result; } public String recommendFallback() { return "No recommend available"; }
- 설정하지 않으면 default 1,000ms
- 설정 시간동안 메소드가 끝나지 않으면 (return / exception) Hystrix는 메소드를 실제 실행중인 Thread에 interrupt()를 호출 하고, 자신은 즉시 HystrixException 을 발생시킨다.
- 물론 이경우에도 Fallback이 있다면 Fallback을 수행
출처: https://netflixtechblog.com/fault-tolerance-in-a-high-volume-distributed-system-91ab4faae74a
0 Comments