본문으로 건너뛰기

Fail-over/Fail-back

Fail-Over

Fail-Over란 서버, 시스템, 노드 등에서 이상이 생겼을 때 예비 시스템으로 전환되는 기능을 의미한다.

BXI의 노드는 Fail-Over역할에 따라 액티브(Active)노드와 백업(Backup)노드로 구분된다. 해당 설정은 노드관리 > 노드정보에서 설정한다.

실행모드내용
액티브노드실행(Active)된 인스턴스를 관리하는 노드
백업노드액티브노드가 장애가 발생하면, 액티브노드의 인스턴스를 실행할 노드. Fail-Over시에 액티브노드의 로깅 인스턴스와 시스템 폴링 인스턴스는 대상이 아니므로 백업노드에서 별도 등록되어야 한다.

백업노드는 헬스체크 메시지를 송신하고, 액티브 노드는 메시지에 대한 응답 처리를 수행한다. 백업노드는 응답 메시지를 수신 받지 못 할 경우 액티브(Active)노드 장애로 감지하고 해당 노드에 할당된 인스턴스를 백업노드에서 실행한다.

정보

헬스체크 프로토콜은 UDP를 사용한다.

동작방식은 시스템 파라미터의 FAILOVER_TYPE 설정으로 정의한다.

설정값내용
자동액티브노드에 할당된 인스턴스를 자동으로 백업노드에서 실행한다.
수동실행관리 > Fail Over에서 관리자가 Fail-over처리를 결정해 실행한다.

Fail-Back

Fail-Back은 액티브노드에서 장애가 발생하여 Fail-Over된 이후에, 장애 발생된 액티브노드를 복구하여 백업노드에서 실행되고 있는 인스턴스들을 종료하고 복구된 노드에서 실행하는 것을 말한다.

Fail-Over된 노드가 있는 경우 실행관리 > Fail Back에 출력되며, 처리 과정은 다음과 같다.

  1. 백업노드에 실행된 인스턴스 종료 조회된 내역 중 주 노드로 복구할 노드를 선택한 후 버튼을 눌러 Fail-Back한다.
  2. 액티브노드의 노드 기동 $BXIHOME/bin/startup.sh을 실행하여 액티브노드의 노드를 기동한다.