RunBook Automationでシステムの再起動を自動化する

投稿日: / 更新日:

こんにちは。

今回はRunBook Automationで、システム再起動の自動化を行ってみようと思います。

RunBook Autmationとは、運用プロセスの実行を自動化し、運用業務の属人化解消や運用ポリシーの統一を図るための機能です。

このRunBook Automationで、CPU使用率を監視し、CPU使用率が異常状態で終了した場合は、システムの再起動をしてよいか承認依頼を送信します。承認された場合はシステムを再起動する、という流れで行っていこうと思います。

それでは設定していきます。

●設定手順

①リソース監視(CPU使用率)の設定

まず、「監視設定」パースペクティブを開き、以下のように設定します。

今回は取得値が0以上25未満の場合は「情報」、25以上50未満の場合は「警告」、それ以外は危険通知となるように設定しました。

 

②ジョブユニットの設定

「ジョブ設定」パースペクティブのスコープツリー配下にある「マネージャ」を選択した状態で「ジョブユニット作成」ボタンをクリックし、ダイアログに以下のように入力します。

デフォルトの値から、今回は「正常」の終了値の範囲を「-5」-「0」、異常の終了値を「-100」と変更しました。

 

③ジョブネットの作成

スコープツリーから②で作成したジョブユニットを選択した状態で、「ジョブネットの作成」をクリックし、以下のように設定します。

ジョブユニットの設定と同じく、デフォルトの値から、「正常」の終了値の範囲を「-5」-「0」、異常の終了値を「-100」と変更しました。

 

④監視ジョブの設定

③で作成したジョブネットを選択した状態で、「監視ジョブの作成」をクリックし、以下のように設定します。

 

⑤承認ジョブの設定

③で作成したジョブネットを選択した状態で、「承認ジョブの作成」をクリックし、以下のように設定します。

監視ジョブが異常状態になったら、承認依頼が求められるように設定しました。

 

⑥コマンドジョブの作成

③で作成したジョブネットを選択した状態で、「コマンドジョブの作成」をクリックし、以下のように設定します。

承認依頼が承認されたら、システムが再起動されるコマンドが実行されるように、「起動コマンド」には「reboot」と設定しました。

 

●ジョブネットの実行

ここから、設定したRBAを行うジョブネットを実行してみます。管理対象ノードのCPU使用率を上げ、設定したジョブネットを実行すると、システムが再起動されCPU使用率が正常になることを確認します。

①初めに、管理対象ノードで以下のコマンドを実行し、CPU使用率を上げます。

[root] #yes  >  /dev/null

 

②設定パースペクティブの設定手順②で作成したジョブユニットを選択し、実行をクリックすると以下のようなダイアログが表示されるので、実行をクリックします。

 

③ジョブ履歴パースペクティブのジョブ設定[一覧]ビューから、実行したジョブユニットを選択すると、以下のようにジョブ履歴[ジョブ詳細]ビューに詳細が表示されます。

 

④更新ボタンをクリックすると、ジョブの実行状態が更新されます。以下のように、最初に実行された監視ジョブが異常状態で終了し、承認ジョブが実行中となっていることが分かります。監視ジョブ異常状態で終了しているため、コマンドジョブは実行されていないことが分かります。

 

⑤承認ジョブが実行されているため、「承認」パースペクティブを開き、承認ジョブが送信する承認依頼を確認します。開くと、承認依頼が以下のように表示されています。

 

⑥承認依頼を開くと以下のようにダイアログが表示されるので、「承認」ボタンをクリックし、承認依頼を承認します。

 

⑦「ジョブ履歴」パースペクティブを開き、実行中のジョブユニットが承認依頼を承認したことで、正常に終了していることを確認します。

 

⑧「監視履歴」パースペクティブを開き、監視履歴を確認すると、システムを再起動するコマンドジョブが実行されたことで、CPU使用率が正常状態になったことが確認できました。

 

以上、システム再起動の自動化の方法のご紹介でした。

Hinemos導入はアトミテックにお任せください

見積もりを依頼する

最新情報発信中

Xやメルマガでも、Hinemosの保守、
開発、導入、構築やカスタマイズ等の
お役立ち情報を発信しています。
是非ご登録ください。