【Hinemos】”カスタム監視”を使用してuptimeを監視する

投稿日: / 更新日:

2.4系以前のカーネルを搭載したLinuxやWindows(クライアントOS、サーバOS問わず)などは、システム起動から約497日を経過すると、様々なシステム上の問題が発生すると言われています。いわゆる「497日問題」ですが、これを回避するには、(用意されていれば)パッチを適用するか、あるいは問題が起きる前にシステムを再起動する必要があります。

パッチを適用せず、定期的な再起動で運用する環境の場合、再起動漏れを予防するためにサーバのuptimeを監視する必要がでてきます。HinemosにはSNMP監視機能があり、uptimeのOIDを指定して監視を行うことができますが、SNMPの応答が数値ではないため、文字列監視の方を設定する必要があり、少しやっかいです(とはいえ、正規表現のマッチングパターンをうまく指定すれば、もちろん監視することは可能です)。

Hinemos ver4.0が利用できる環境なら、このバージョンで新たに追加された「カスタム監視」を利用するのが便利です。ここではカスタム監視を使用して、対象サーバ上でsnmpwalkコマンドを実行し、出力内容をperlで少し加工して取得します。これにより、uptimeの範囲を閾値として設定することができます。

設定内容のイメージは以下のとおりです。ちなみに、ここでは便宜上、閾値を「情報:0~80分、警告:80~90分、危険:90分~」としています。

カスタム監視でuptimeの監視設定を行っている様子

カスタム監視でuptimeの監視設定を行っている様子

ここで、”コマンド”には以下のように設定しています。

処理内容としては、取得したTimeTick値を(便宜上)分の単位へ直して、"uptime,"という文字列と一緒に出力しています。取得した値をカスタム監視へ渡すためには、上記のような「キー,値」の形式に直す必要があります。

なお、特筆すべき点として、SNMPバージョンとコミュニティにはノード変数を設定しています。ノード変数はコマンド実行時に、リポジトリ上でそのノードに設定された値へ展開されるため、これを利用して、一つの監視設定でSNMPバージョンやコミュニティの異なるノードをまとめて監視することができます。

監視結果は以下のとおりです。

カスタム監視の結果(イベント通知)

カスタム監視の結果(イベント通知)

カスタム監視の結果(イベント通知の詳細)

カスタム監視の結果(イベント通知の詳細)

うまく、uptimeを監視することができました。

以上簡単ですが、Hinemos 4.0のカスタム監視に関するトピックをご紹介しました。

最新情報発信中

Twitterやメルマガでも、Hinemosの保守、
開発、導入、構築やカスタマイズ等の
お役立ち情報を発信しています。
是非ご登録ください。