すべてのレイヤーが稼働しなくてはならないサーバのためのネットワーク監視

By | 2015年5月28日

ネットワークサーバの複雑さ

サーバの稼動を考えたときに、サーバのハードウェアがおかしくなっても、サーバで稼動しているアプリケーションまたは、アプリケーションとネットワークをつなぐ部分の動作がおかしくなっても、ネットワークそのものや接続先とのリンクがおかしくなっても、「サーバが異常」という現象になってしまいます。そこで、すべてのレイヤーに対する監視が必要になってきますが、大規模なシステムでなければ、あまり多くの人を監視に割くわけにもいきません。そこで、監視サーバや、アプリによるネットワーク監視が必要になってきます。サーバ側に、状態ログを出力するアプリを導入すれば、サードパーティーによる集中監視も可能になります。

ハードウェア異常に対する監視と対処

ハードウェアの異常に対しては、単純な手法としては、監視サーバから、各サーバへpingを打ち込み、それに対して返事が来るかを監視する方法が考えられます。ただし、その場合、ハードウェアの一部に不具合があるものの、ハードウェアとしては動作している状況を見つけることはできません。そこで、さらにアプリを導入し、接続されているハードウェアの動作チェックを定期的に行いながら、その結果を監視サーバへ返す方法が考えられます。重大な異常でなければ、業務時間に対処することができますが、もし、重大な異常の場合、別のサーバに業務分散をさせて、業務時間になってから、当該サーバの復旧を図る方法が考えられます。

アプリケーション異常に対する監視と対処

サーバにおけるアプリケーションの異常を監視する方法として、監視サーバ側から、アプリケーションにタスクを提供し、正しい処理結果が返ってくるかを監視する方法が考えられます。もし、異常があった場合、単純なハングアップ等であれば、監視サーバ側から、アプリケーションや、サーバの再起動を行わせるという対処法が考えられます。また、何者かによって改ざんされことが原因と思われる異常であれば、監視サーバ側から従来のアプリケーションを自動でインストールし、動作させる方法も考えられます。また、ネットワーク層の異常については、可能であれば、通信会社のマターとなるようにすると維持コストもかからなくて済みます。

ネットワーク監視の仕事は、ネットワークの保守や点検も含まれており、ネットワークに何らかのトラブルにが起こった際にすぐに対処する仕事となっています。