Fail-over/Fail-back
Fail-Over

Fail-Over란 서버, 시스템, 노드 등에서 이상이 생겼을 때 예비 시스템으로 전환되는 기능을 의미한다.
BXI의 노드는 Fail-Over역할에 따라 액티브(Active)노드와 백업(Backup)노드로 구분된다.
해당 설정은 노드관리 > 노드정보
에서 설정한다.
실행모드 | 내용 |
---|---|
액티브노드 | 실행(Active)된 인스턴스를 관리하는 노드 |
백업노드 | 액티브노드가 장애가 발생하면, 액티브노드의 인스턴스를 실행할 노드. Fail-Over시에 액티브노드의 로깅 인스턴스와 시스템 폴링 인스턴스는 대상이 아니므로 백업노드에서 별도 등록되어야 한다. |
백업노드는 헬스체크 메시지를 송신하고, 액티브 노드는 메시지에 대한 응답 처리를 수행한다. 백업노드는 응답 메시지를 수신 받지 못 할 경우 액티브(Active)노드 장애로 감지하고 해당 노드에 할당된 인스턴스를 백업노드에서 실행한다.
정보
헬스체크 프로토콜은 UDP
를 사용한다.
동작방식은 시스템 파라미터의 FAILOVER_TYPE
설정으로 정의한다.
설정값 | 내용 |
---|---|
자동 | 액티브노드에 할당된 인스턴스를 자동으로 백업노드에서 실행한다. |
수동 | 실행관리 > Fail Over 에서 관리자가 Fail-over처리를 결정해 실행한다. |
Fail-Back
Fail-Back은 액티브노드에서 장애가 발생하여 Fail-Over된 이후에, 장애 발생된 액티브노드를 복구하여 백업노드에서 실행되고 있는 인스턴스들을 종료하고 복구된 노드에서 실행하는 것을 말한다.
Fail-Over된 노드가 있는 경우 실행관리 > Fail Back
에 출력되며, 처리 과정은 다음과 같다.
- 백업노드에 실행된 인스턴스 종료 조회된 내역 중 주 노드로 복구할 노드를 선택한 후 버튼을 눌러 Fail-Back한다.
- 액티브노드의 노드 기동
$BXIHOME/bin/startup.sh
을 실행하여 액티브노드의 노드를 기동한다.