장애를 어디서 끊고 어디서 격리할지를 시나리오로 풀어낼 수 있는지 본다. 한 가지 패턴만 외워서 답하는지, 즉시 완화와 구조적 방어를 구분해 우선순위로 가져가는지를 가른다.
동기 호출은 외부가 느려지면 내 쪽 스레드와 커넥션이 그대로 묶인다. 장애가 길어지면 대기가 쌓여 정상 트래픽까지 같이 터진다. 1차 방어는 타임아웃으로 대기를 끊는 것이고, 그 다음은 벌크헤드로 자원을 격리해 한 의존성의 장애가 전체로 번지지 않게 막는다. 지속 실패가 보이면 서킷 브레이커로 빠르게 실패시켜 자원을 아끼고, 회복 신호가 오면 점진적으로 다시 열어준다.
외부 의존이 느려져 커넥션 풀이 마르거나 스레드가 묶였던 경험이 있다면, 그때 무엇을 가장 먼저 끊었는지로 연결할 수 있다
특정 다운스트림 하나가 전체 응답을 묶었던 경험이 있다면, 벌크헤드 분리 단위 설계 이야기와 엮을 수 있다
서킷 브레이커를 도입했다가 임계값이 너무 빡빡해 정상 호출까지 막아본 경험이 있다면, 임계값 보정 과정으로 풀 수 있다
아직 공개된 답변이 없어요. 첫 공개 답변을 남겨보세요.