事例紹介

金融系システム基盤へのHinemosの導入

VMware ESXi仮想化環境において、VM管理オプションを活用してHinemosを導入した事例です。

背景

某SI企業様にてシステム・インテグレーションされている金融系システム基盤構築案件で、エンドユーザ環境のサーバやネットワーク機器の監視、及びジョブのスケジューリングにHinemosを採用したいとのことで、この度、弊社に引き合いを頂きました。

 

エンドユーザ環境は、Hinemosマネージャ機を除く全てのサーバがWindowsサーバで、仮想化ソフトウェアにVMware ESXiを採用しており、仮想ゲスト、物理ホスト、N/W機器等合わせて50台程度のノードが監視対象です。なお、仮想ゲストに関しては、VM管理オプションを使用して正確なリソース値を取得したい、とのご要望を頂きましたので、VM管理オプションも導入させて頂きました。

 

ジョブについては、基盤ジョブ・業務ジョブ合わせて40個程度と僅少ですが、業務ジョブの実行サーバ(兼データベースサーバ)はMSFC(Microsoft Failover Cluster)で冗長化されており、サーバが待機系へ切り替わっている間はそちらでジョブを実行する、という仕組みを入れる必要がありました。

 

また、この案件では、ディザスタリカバリのための災害対策環境を別拠点に構築しており、本番環境と合わせて2環境にHinemosを構築、またそれらの間で連携をとる必要がありました。

システム構成

システムは、本番環境と災害対策環境の2系統で構成されています。

 

災害対策環境については、大震災等の発生時に本番環境および担当者につながらない場合でも災害対策環境で運用を継続できる、というコンセプトで構成されています。

 

規模

本番環境:

 監視対象:RHELサーバ、Windowsサーバ十数台(VMware ESXi、物理サーバの混在環境)、Windowsクライアント30台程度(VMware ESXi仮想ゲスト)、N/W機器

 ※MSFCによる冗長化構成含む

 

災害対策環境:

 監視対象:Windowsサーバ数台、N/W機器

 

構成

Hinemos ver 3.2.0 新規構築(後に、マネージャのみ ver 3.2.1 へバージョンアップ)

VM管理オプション ver 2.1.0

 

Hinemos用途

リソース監視、生死監視、H/W障害監視、DB監視、ログ監視、ジョブスケジューリング

※リソース監視はVM管理オプションも併用

※本番環境から災害対策環境の監視も実施

 

設計と導入

オーソドックスなシステム構成のため、設計に苦慮することはほとんどありませんでしたが、留意すべき点として、ジョブの運用管理対象サーバにMSFCが導入されている事が挙げられます。

 

監視設計

ノード数、監視項目数はそれほど多くないため、構築や監視設定の投入、及び試験については、大きな問題なく進めることができたとはいえ、やはりHinemosの監視設計でミソとなるのは、スコープ設計と通知ポリシーです。スコープの設計にあたっては、予め監視要件と今後の運用をヒアリングした後に、見やすく、メンテナンスし易い設計を心掛けました。

 

なお、仮想ゲストOSの監視にはVM管理オプションの機能を、物理サーバの監視には通常のHinemos機能を、という具合に使い分けを考慮して設計を行いました。またMSFCへの対応として、仮想IPへの監視、実IPへの監視という点も考慮して対応しました。

 

さらに、通知についてはHinemosマネージャへの負荷を考慮し、必要に応じて通知の抑制を実施しました。

 

ジョブ設計

ジョブ数は40程度と少なく、ジョブ実行条件の分岐も構築過程で変更はありましたが、特に問題なく対応することができました。なお今回、ジョブ設計にあたっての一番のポイントは、MSFC上で稼働するジョブであり、また災害時の実行も考慮する必要がある、という点でした。

 

サーバが待機系へ切り替わっている間のジョブ実行方法については、Hinemosのジョブの特性を考慮した上で、必要に応じてスコープ割当なども用いて、設計を行いました。また、本番環境と災害対策環境との連携については、災害発生時のジョブ運用に関しては手動による切り替え作業をされるということで、環境の切り替え発生時にジョブを自動的に引き継ぐ設定は行いませんでした。

 

その他

お客様から、Windows Server 2008の新しい形式のイベントログ機構「Windows Eventing 6.0」についても監視したい、とのご要望も頂きましたが、導入当時のHinemosのバージョン(厳密にはNTsyslog)はこれに対応していなかったため、代替策として、Windowsのタスクスケジューラで特定のイベント発生をトリガーとしてWindowsイベントログに出力するようにして、ご要望を実現しました。なお、現在の最新バージョンのHinemos(ver 3.2.2)ではWindows Server 2008「Windows Eventing 6.0」にも対応しています。

保守

試験を終え、エンドユーザ様の運用がスタートした後も、サーバ構成やジョブ構成の変更、あるいは障害検知レベルの見直しなど、その時々でのお客様のご要望に合わせて、都度、監視やジョブ設定等の見直しを行っていきました。

 

また、Hinemosのいくつかの機能上の課題にも直面し、継続してそれらへのサポート対応も行いました。

 

様々な紆余曲折がありましたが、現在ではHinemosも概ね大過なく稼働しているとのことで、弊社としても大変嬉しく思っています。