収集値統合監視について

投稿日: / 更新日:

今回は、Hinemos6.1から新たに追加された収集値統合監視についてのご紹介です。

 

収集値統合監視機能は、数値監視や文字列監視の監視結果を元に、複数の条件を指定して判定を行うことのできる機能で、組み合わせ次第でいろいろな使い方ができます!

今回は例として、同一サーバでCPU使用率、メモリ使用率が同時に高騰した場合、危険判定で通知させる定義を作成します。

1.準備

①Hinemosのリソース監視機能であらかじめCPU使用率、メモリ使用率を収集しておきます。

※収集値統合監視は、監視を行いたい項目に対して、あらかじめHinemosの監視機能を用いて収集を行う必要があります。

 

②収集値統合監視(監視項目ID:techdiary_test01)を以下のように設定します。

・通知先スコープ:先程リソース監視を設定した管理対象ノード
・収集の順序を考慮しない:チェック
・タイムアウト(分):3分
・メッセージ:OK(判定条件にすべて一致した場合)「異常が発生しています。」 → 危険判定
NG(判定条件に一部一致した場合)「正常に動作しています。」 →情報判定

 

 

判定条件は以下のように設定します。

・対象ノード:監視設定のスコープを使用する
・収集値表示名:「CPU使用率」または「メモリ使用率」
・収集値種別:数値
・判定: > (「判定値以上」を意味します。)
・判定値:任意の値(今回はCPU使用率を70%以上、メモリ使用率を50%以上とします。)

 

③仮想マシンでコマンドを実行し、意図的にメモリ使用率、CPU使用率を上げます。

 

2.結果

・メモリ使用率とCPU使用率の両方をあげた場合(判定条件すべてに当てはまる場合)

→ 監視項目ID:techdiary_test01から危険通知が行われました。

 

・CPU使用率のみを上げた場合(判定条件のいずれかにあてはまる場合)

→ 監視項目ID:techdiary_test01から情報通知が行われました。

 

・メモリとCPUの使用率が判定値以下の場合(判定条件のどれにも当てはまらない場合)

→ 監視項目ID:techdiary_test01からの通知は行われません。

今回は「収集の順序を考慮しない」設定で監視を行いましたが、該当欄にチェックを外した場合、判定条件の定義は上から順(番号が若い順)に処理され、最上位の判定値に当てはまらない場合は、通知されません。

 

いかがでしたでしょうか。

冒頭にも記載いたしましたが、組み合わせによっていろいろな使い方ができる点が魅力です。例えばこんな監視も可能です。

・複数のサーバのうち、1台だけがpingを返さなくなってしまった場合、警告判定の通知を行う。
・ログファイルにある文字列が出力されたあと、指定した時間内にプロセスが起動しているかどうかを監視する。

Hinemos ver 6.1の新機能をぜひお試しください。

以上、収集値統合監視についてのご紹介でした。

最新情報発信中

Twitterやメルマガでも、Hinemosの保守、
開発、導入、構築やカスタマイズ等の
お役立ち情報を発信しています。
是非ご登録ください。