14.5.스웜 클러스터의 고가용성

단일 클러스터를 여러 지역의 데이터센터에 걸쳐 구성 (X) * 이런 방법으로 고가용성을 확보하는 것도 이론적으로는 가능하다. * 매니저 노드는 데이터센터 A에 두고, 데이터센터 A, B, C에 워커 노드를 배치할 수도 있다. * 이렇게 하면 확실히 클러스터 관리는 단순해지지만 네트워크 지연 시간이라는 문제가 새로 발생한다. * 스웜을 구성하는 노드는 서로 활발하게 통신을 주고받는데, 만약 이 클러스터를 운영하는 중에 데이터센터 A와 B 사이에 심각한 네트워크 지연이 발생한다면 어떻게 될까? 매니저 노드는 데이터센터 B의 노드가 모두 연락이 두절됐다고 판단하고 모든 컨테이너를 데이터센터 C의 워커 노드로 재배치하려 들 것이다. * 그다음에는 상황이 더욱 악화될 수 있다. 서로 다른 지역에 위치한 매니저가 각자 자신이 리더 매니저라고 판단해 클러스터가 분열될 가능성이 생긴다.

복수의 클러스터를 여러 지역의 데이터센터에 걸쳐 구성 (O) * 지역을 아우르는 거대한 규모의 장애에도 애플리케이션이 계속 동작해야 할 필요가 있다면, 이를 실현할 수 있는 방법은 클러스터를 여러 개 구성하는 것뿐이다. * 관리적 측면으로는 오버헤드가 발생하고 애플리케이션이 서로 다른 클러스터로 떠다닐 우려가 있지만, 네트워크 지연과 달리 이 정도 문제는 충분히 통제할 수 있다. * 그림 14-13은 이러 한 구성을 도표로 나타낸 것이다.

links

social