【Hinemos ミッションクリティカル】Hinemos ミッションクリティカル機能でのトラブルシューティング

投稿日: / 更新日:

 

■はじめに

今回、この記事ではHinemos ver.7.0のミッションクリティカル機能導入時に起動しない、起動したがフェイルオーバーしてしまうといった状況でのトラブルシューティングの例をご紹介します。

なお、本記事はLinux環境を想定としたトラブルシューティングとなっています。ご了承ください。

●コンフィギュレーションスクリプトの確認

設定完了後の初回起動時に動作不良が起きる場合には、コンフィギュレーションスクリプトでの設定が原因の可能性があります。
以下の点を確認の上、再度コンフィギュレーションスクリプトを実行してください。

  1. 使用するスクリプトの確認
    Hinemos ver.7.0のミッションクリティカル機能では、オンプレミス環境、Amazon Web Service環境、Microsoft Azure環境、 VMware vSphere環境、Hyper-V環境に対応しており、それぞれの環境ごとに使用するコンフィギュレーションスクリプトが異なります。ご利用の環境に合わせたコンフィギュレーションスクリプトをご実行ください。
    ・オンプレミス環境:hinemos_ha_configure.sh
    ・Amazon Web Service環境:hinemos_ha_configure_aws_vip_routetable.sh
    ・Microsoft Azure環境:hinemos_ha_configure_azure.sh
    ・VMware vSphere環境:hinemos_ha_configure_vmware.sh
    ・Hyper-V環境:hinemos_ha_configure_hyperv.sh

  2. IPアドレスの確認
    コンフィギュレーションスクリプトでは1系および2系のIPアドレスに加え、孤立検知サーバのIPアドレス、(使用する場合は)FIPとして付与する仮想IPアドレスと、複数のIPアドレスを入力いたします。
    入力箇所や入力内容にお間違えの無いようご注意ください。

●hinemos_manager_cluster.logの確認

MasterサーバのHinemosマネージャ(JavaVM)が落ち、フェイルオーバーが発生してしまう場合にはhinemos_manager_cluster.logを確認することで障害の原因を特定できる可能性があります。
hinemos_manager_cluster.logはマネージャインストールディレクトリ(デフォルトでは/opt/hinemos)のvar/log配下に出力されます。
ここからは出力されるログと対応する障害、復旧方法の一例をご紹介いたします。
なお、フェイルオーバーの原因について障害解析が必要な場合には、Hinemosのサポート窓口までお問合せください。

1.孤立検知サーバとの通信失敗

上記のようなログが出力されていた場合には、孤立検知用サーバとの通信失敗が原因と考えられます。
孤立検知用サーバとマネージャ間のネットワーク設定(ファイアウォール等)をご確認ください。

2.Hinemosマネージャ(JavaVM)からの応答なし

上記のようなログが出力されていた場合には、Hinemosマネージャ(JavaVM)に何らかの障害が発生し、Hinemosマネージャからの応答がなくなったことが原因と考えられます。
以下の復旧方法をお試しください。

  1. 旧Masterサーバの障害を取り除き、OSが正常に起動する状態まで復旧する

  2. 旧Masterサーバ上にて以下のコマンドを実行し、プロセスあるいはFIPが確実に停止された状態にする
  3. 旧MasterサーバをStandbyサーバとして起動する

  4. 必要に応じて手動フェイルオーバーを実行し、旧MasterサーバをMasterサーバに遷移させる

3.FIP未割り当て

上記のようなログが出力されていた場合、MasterサーバのFIPが予期せず未割り当てとなり、ヘルスチェックで障害を検知したことがフェイルオーバーの原因となっている可能性があります。
以下の復旧方法をお試しください。

  1. 旧Masterサーバの障害を取り除き、OSが正常に起動する状態まで復旧する

  2. 旧Masterサーバ上にて以下のコマンドを実行し、プロセスあるいはFIPが確実に停止された状態にする
  3. 旧MasterサーバをStandbyサーバとして起動する

  4. 必要に応じて手動フェイルオーバーを実行し、旧MasterサーバをMasterサーバに遷移させる

 

■おわりに

この記事ではHinemosのミッションクリティカル機能が正常に動作しない場合に確認すべき点や復旧方法についてご紹介いたしました。
皆様のHinemosをご利用の際にお役に立てましたら幸いです。

Hinemos導入はアトミテックにお任せください

見積もりを依頼する

最新情報発信中

Xやメルマガでも、Hinemosの保守、
開発、導入、構築やカスタマイズ等の
お役立ち情報を発信しています。
是非ご登録ください。