Hosting Department:ホスティングを活用するための基礎知識

第18回サーバ運用監視のノウハウ(その2)

24時間365日、サーバを安定して運用するためには、稼働状況をリアルタイムに把握するサーバ監視ツールが必須です。サーバ監視ツールは障害が発生した際にアラームを発信して管理者に知らせると同時に、短時間での原因特定を支援します。そこで今回は、オープンソースで使えるサーバ監視ツールを中心に紹介しましょう。

サーバ監視ツールとは?

サーバの稼働状況を知る最も単純な手段といえば、管理者がマニュアル操作でコマンドを実行することでしょう。しかし、マニュアル監視は、手順書を作成する手間や、管理者の人件費等のコスト面からみて現実的とはいえません。システムの規模が小さく、監視対象となるサーバやネットワーク機器が数台レベルなら、自作のスクリプトでも対応可能です。しかし、サーバの規模が大きくなると、スクリプト自体の管理・運用に手間がかかります。スクリプトを適切にメンテナンスするためには、管理者にも高度なスキルが求められます。管理者のスキルが不足していると、スクリプトの記述ミスなどによって適切な監視ができなくなる可能性もあります。

適切なサーバ運用監視を実現するなら「サーバ監視ツール」の導入が現実的です。サーバ監視ツールを使えば、サーバやサービスが正常に稼働しているかどうかを監視する「死活監視」と、CPU、メモリ、ディスク容量、ネットワークなどの使用状況をモニタする「リソース監視」を行うことができます。監視作業はツールによって自動化され、障害が発生した際はメール等で通知されるため、サーバの運用管理者は面倒な手間をかけることもありません。

サーバ監視ツールは、大手ベンダなどが販売する商用製品と、オープンソースソフトウェア(OSS)の2種類に大別されます。商用製品の代表例としては、日立製作所の「JP1⁠⁠、富士通の「SystemWalker⁠⁠、NECの「WebSAM⁠⁠、IBMの「Tivoli⁠⁠、HPの「HP Software(旧OpenView)などが挙げられます。商用製品は、資産管理、構成管理、ユーザ管理、セキュリティマネジメントなど監視以外の機能も充実しているため、システム全体の管理を行うケースでは非常に有効です。しかし、機能が充実している分、ツール自体が高価で、ライセンス費用から構築費用、設定費用なども含めると数百万円から数千万円のコストがかかることも珍しくありません。そのため、基本的には数千台クラスの大規模システムに利用されるケースが多いようです。

OSSのサーバ監視ツールにできること

OSSのサーバ監視ツールは、ソフトウェアライセンス無料で利用できます。ソースコードが公開されているためソフトの改編も可能で、利用者の管理用途に合わせて機能を柔軟に設定できるメリットがあります。機能は商用製品ほど充実していませんが、複数のサーバやネットワーク機器に対する、⁠死活監視⁠⁠、⁠リソース監視⁠⁠、⁠アプリケーション監視⁠⁠、⁠プロセス監視⁠⁠、⁠ログ監視」などの項目はほとんど網羅しています。また、監視データに対してしきい値を設定し、異常値を検出した時に管理者にメール等で知らせる通知機能や、トラブルが発生した際にあらかじめ設定しておいた管理コマンドを実行する機能も装備。さらに、システムのリソースをビジュアル化したり、情報収集機能によって取得した過去のデータをグラフ化したりする表示機能も備えています。

OSSのサーバ監視ツールは、商用製品のように大規模サーバの監視や、高度な管理が要求されるサーバには向きませんが、監視機器の台数が数台から数百台、千台程度の小規模、中規模の監視には十分なツールといえます。ただし、自由度が高い分、構築の際はサーバやデータベースの知識が必要になるケースがあります。システムやサーバの調査、監視項目の洗い出し、しきい値の設定などが必要になるため、OSSの知識やノウハウの他、運用担当者の技術力も求められます。ライセンスコストはかかりませんが、構築費用やサポートコストがかかることも忘れてはなりません。

代表的なOSSのサーバ監視ツール

OSSのサーバ監視ツールにはさまざまな種類が存在し、代表的なツールとして「Nagios(ナギオス⁠⁠、⁠Zabbix(ザビックス⁠⁠、⁠Hinemos(ヒネモス⁠⁠、⁠GroundWorkMonitor(グラウンドワーク・モニター⁠⁠、⁠Xymon(シモン⁠⁠」などがあります。それぞれ監視サーバの対応OS、管理対象となるエージェントの対応OS、管理インタフェース、監視データの保存方法、表示方法などが異なります。特に管理インタフェースの日本語対応や監視設定方法、管理データの保存方法などは注意が必要です。

Nagios

Nagiosは、OSSのサーバ監視ツールの中で最も実績があり、日本語の情報も充実しています。元々は「NetSaint」の名称でリリースされ、バージョンアップを重ねてきましたが、現在はNagiosに引き継がれています。

Nagiosは、稼働監視をプラグインによって行う点が特徴です。基本機能で監視できる項目は多くありませんが、専用のコミュニティサイトに公開されている多数のプラグインを利用して監視項目が追加できます。プラグインは利用者が独自に開発することも可能です。

Nagiosでは、監視設定をテキストファイルに保存します。そのため、設定がやや複雑で管理も煩雑になりがちです。障害の発生履歴もテキストファイルに記録されます。履歴データは最終値のみが保存されるため、過去のデータを参照することができません。収集した情報はWebブラウザで表示できます。ただし、障害表示は一覧表示のみに対応し、情報収集機能で取得した過去のデータは表示できません。また、リソースグラフを作成も不可となっています。監視結果は基本的にメールでシステム管理者に通知される他、監視サーバ側のスクリプト実行に対応しています。

Zabbix

Zabbixは、ラトビア共和国のZABBIX SIA社が開発を行っているサーバ監視ツールです。開発を企業が行っていることから商用サポートが充実しています。Nagiosより後発であるため、利用実績は乏しいものの、日本にもコミュニティサイトが存在し、さらにミラクル・リナックス社が日本における商用サポートと導入サービスを提供しています。

監視対象のエージェントOSは、Linux、Windows、Solaris、AIX、HP-UX、Mac OS X、FreeBSD、OpenBSDと幅広く対応していることから、複数のサーバやネットワーク機器をZabbixで一元管理できる点がメリットです。

監視設定はWebブラウザから行います。ほとんどが選択式なので、設定はいたって簡単。専用エージェントも不要のため外部からも設定できます。収集したデータは指定した期間分だけRDBMSに蓄積され、監視対象や項目ごとにデータの参照が可能。高度な表示機能を利用してグラフィカルなグラフを作成したり、詳細なレポートや見やすいマップを作成したりすることで、リソースの使用傾向や障害傾向が的確に把握できます。監視結果はメール通知と監視サーバ側のスクリプト実行の他に、エージェント側でのスクリプト実行に対応しています。

その他

Hinemos

NTTデータが開発した国産のサーバ監視ツールです。日本で開発が行われているため、日本語の情報が充実しています。監視設定は専用クライアントを用い、収集したデータは指定した期間分だけRDBMSに蓄積されます。監視機能の他、ジョブ管理、性能管理、一括制御の機能を備えています。

GroundWork Monitor

米GroundWork Open Source社が開発を行っているサーバ監視ツールです。Nagiosなど複数のOSSを組み合わせて一元管理を実現しています。日本コミュニティが存在する他、富士通SSLが日本における商用サポートと導入サービスを提供中です。

Xymon

「Hobbit」の名称で提供されていたサーバ監視ツールで、OSSの「BigBrother」のアドオンソフト「bbgen」をベースとしています。監視設定はテキストファイルで行い、収集したデータはRRD Toolsを介して保存されグラフの表示が可能です。導入実績は豊富ですが、日本語情報は少なめです。

おすすめ記事

記事・ニュース一覧