Fail-over/Fail-back
Fail-Over

Fail-Overとは、サーバーやシステム、ノードなどに異常がある時、予備システムに切り替えられる機能を意味する。
BXIのノードは、Fail-Overの役割によって、アクティブ(Active)ノードとバックアップ(Backup)ノードに区分される。
当該設定は、Node Management > Node Information
で設定する。
実行モード | 内容 |
---|---|
アクティブノード | 実行(Active)されたインスタンスを管理するノード |
バックアップノード | アクティブノードに障害が発生した際に、アクティブノードのインスタンスを実行するノード。Fail-Over時、にアクティブノードのロギングインスタンスとシステムポーリングインスタンスは対象ではないため、バックアップノードで別途登録する必要がある。 |
バックアップノードは、ヘルスチェックメッセージを送信し、アクティブノードはメッセージに対する応答処理を行う。 バックアップノードは、応答メッセージを受信できない場合、アクティブ(Active)ノード障害を検知し、当該ノードに割り当てられたインスタンスをバックアップノードで実行する。
info
ヘルスチェックプロトコルはUDP
を使用する。
動作方式は、システムパラメータのFAILOVER_TYPE
設定で定義する。
設定値 | 内容 |
---|---|
自動 | アクティブノードに割り当てられたインスタンスを自動的にバックアップノードで実行する。 |
手動 | 実行管理 > Fail Over で管理者がFail-over処理を決定して実行する。 |
Fail-Back
Fail-Backとは、アクティブノードで障害が発生してFail-Overした後、障害が発生したアクティブノードを復旧してバックアップノードで実行されているインスタンスを終了し、復旧したノードで実行することを意味する。
Fail-Overしたノードがある場合、Execution Management > Fail Back
に出力され、処理プロセスは下記のとおりである。
- バックアップノードに実行されたインスタンスの終了、 照会されたログのうち、主なノードに復旧するノードを選択した後、ボタンを押してFail-Backする。
- アクティブノードの起動、
$BXIHOME/bin/startup.sh
を実行して、アクティブノードを起動する。