システム監視・IT監視
システム監視・IT監視とは、ITやシステムの動作の正常性を監視し、故障の予防や原因特定につなげるためのものです。故障が発生してから対処するよりも素早く的確な対処が行えます。一方でデメリットもありますので、よい点だけでなく悪い点も把握した上で運用するようにしてください。
システム監視の仕事内容
システム監視と一口にいっても、その内容は多岐にわたります。単一の監視だけでは不十分なことが多く、システムの状態やログをはじめさまざまな情報からの判断が必要です。具体的な仕事内容を種類ごとに解説しましょう。
サーバー監視
サーバー監視とは、サーバーが正常に稼働しているかチェックすることです。またチェックした結果を基に、障害が発生していたらシステム管理者へ通報します。サーバー管理では、サーバーが正常に稼働していない場合に、管理者へ通報する「異常監視」と、サーバーが正常に稼働している場合には、管理者が見てわかるようにする「正常監視」の二つ監視があります。
インフラ監視(ネットワーク・リソースの監視)
インフラ監視とは、企業のコンピューティングネットワークを構成しているシステムやプロセス、機器からのデータをリアルタイムに収集し分析を行います。その結果、パフォーマンスの問題が緊急事態となる前に予測・特定しネットワーク管理者へ通知を行います。
サービス監視
サービス監視とは、社内や社外ネットワーク上の各サーバーが展開しているシステムの基盤となるサービスの稼働状況を監視することです。これらの監視しているサービス障害の予兆を検知や、予期できないサービス障害が発生してしまった場合に迅速な対応をとれるように、管理者へ通知します。
より具体的には、たとえば以下のような監視を行います。
ポート
任意のTCPポートの接続可否と応答時間を監視します。特定のTCPポートを使ったサービスの稼働状況を監視可能です。
HTTP/HTTPS
任意のURLに対して接続を行い、コマンドの送信結果や応答時間を監視します。サイトの稼働状況を監視可能です。
生死監視
生死監視(死活監視)とは、コンピューターやシステムが正常に稼働しているか外部から、継続的に監視することです。最善のシステム構築をしていたとしても、設備環境やネットワークなどの要因により不測の事態が発生し、システム停止状態になる可能性はあります。システム停止していることで大きな障害へつながる可能性もあります。そうならないように、生死監視にも、大きく分けると「アクティブ監視」と「パッシブ監視」があります。「アクティブ監視」は、監視対象の機器に対し定期的にICPMパケットを送信し応答を確認しています。一方、「パッシブ監視」は、WATCHDOG機能を利用して、監視対象機器から定期的に送信されるパケットを監視し、一定期間パケットが到達しなければ障害が発生したと判断します。
環境監視
環境監視とは,システム内で稼働しているサーバーやアプリケーション、ネットワークなどが正常に動いているかを定期的に確認することで、システムで発生した障害やリソース不足を検知し、システム管理者へ通知を行います。
ログ監視
ログ監視とは、ツールを使ってサーバーやネットワーク機器から転送されてくるログやメッセージを利用して、監視対象のデバイスやシステム、アプリケーションが正常に稼働しているかを確認します。
スクリプト監視
スクリプト監視とは、ツールがインストールされているサーバーないで、「.bat」、「.sh」、「,Java」などのファイルを実行し、スクリプト実行の可用性、実行するまでに要した応答時間、及び実行出力された結果を可視化することでシステムの状態を確認しています。
リソース監視
リソース監視とは、システム上に存在する機器のCPUやメモリ、ディスクの使用率やネットワークの帯域使用率などを監視するものです。CPU使用率やメモリ使用率が異常に高い場合は何かしらの不具合が起こっている可能性がありますし、ネットワークの帯域使用率が異常に低い場合は正しい動作が行われていないかもしれません。
DB監視
サーバー上で運用されているデータベース(DB)を監視するのがDB監視です。データベースに接続できるか、セッション数が異常でないかなどを監視することにより、データベースが正しく動作しているか判断できます。
システム監視
システム監視は、OS上で動作しているプロセスを監視するものです。稼働プロセス数を監視することで、普段と異なる状態に陥っていないか監視できます。また、Windowsなど特定OSに対してOSサービスのステータスを監視するというものもあります。
システム詳細監視
システム詳細監視は、より具体的にシステム上のデータを監視するものです。たとえばメールが指定した時間内にサーバーに到達しているか、特定のファイルの更新日時やサイズが想定通りか、ログに想定通りの内容が出力されているかなど、実動作に近い内容の監視を行います。
システム監視を業務委託してコスト軽減
システム監視の目的や重要性、監視ツールについて説明をしてきました。システム監視を行うことで、ハードウェアやアプリケーション、ネットワーク機器などの障害によりシステムダウンした際、障害復旧の迅速な対応ができます。さらに、過去のパターンや傾向に基づき問題が発生しそうな場所の予測もできます。システム監視を自社で行う場合、監視ツールにかけるコスト、専任社員の人件費などを考えると、外部へ業務委託したほうがコストを軽減できます。システム監視を業務委託する際には、複数のサービス提供会社を比較検討することをおすすめします。
アウトソーシング会社を安さだけ選ぶのは要注意
情報システム部門では社内の重要な機密情報を取り扱うため、アウトソーシング会社を選ぶ際には安易に「安さ」だけで決めてはいけません。まずは、情報の取り扱いがしっかり行われていることを大前提にすることが必要です。
知らないと損をする重要なポイントを押さえつつ、おすすめできるアウトソーシング会社をご紹介します。これにより、リスクを下げた情シスアウトソーシングの選択ができるようになります。
システム監視の目的
システム監視には以下のような目的があります。
サービスの正常性を担保する
システムが提供するサービスは一般的に365日/24時間動き続けなくてはならず、サービスの停止によって損害が発生する可能性もあります。
システム監視によって故障や障害を予知できればサービス停止に至る前に対処できますし、早期に発見できれば損害を最小限に抑えられるでしょう。
障害発生を予防する
システムで使われている機器のなかには寿命が存在するものがあります。
たとえばSSDには書き込み回数の上限が存在し、それを超えると正常に動作しません。システム監視によって書き込み回数を監視すれば故障前に交換できますし、異常な書き込みを検知して対処できれば寿命を延ばせるでしょう。
また、CPUは温度が高くなると熱暴走するため、温度を監視すれば熱暴走発生前に冷却機構を改善し、障害予防につなげられます。
障害発生の原因を発見する
システムに障害が起こったとき、早期復旧に重要なのが初動です。
何が原因で障害が発生したのかわかればすぐに正しい対処をでき、早期解決につながります。
十分なシステム監視を行っていれば障害発生時にすでに多くの情報が集まっており、原因をすぐに特定できるでしょう。
システム監視を行うメリット
システム監視を行うとさまざまなメリットを享受できます。
顧客満足度向上につながる
スマホやクラウドなどの普及により最近では多くの人が24時間稼働のシステムを何らかの形で利用しています。
利用者はシステムが提供するサービスは使えて当たり前と思っており、利用できない期間が存在するとそれを不満に感じるでしょう。
その結果、ほかの企業に顧客が流出するかもしれません。
逆に、システム監視によってシステムを安定して稼働させられれば、既存顧客の引き留めとともに他社からの流入も期待できます。
機会損失が減る
ネットショッピングサイトを提供するシステムに障害が起こった場合、障害発生中は注文を受け付けられず収益が減少します。
特にクリスマスシーズンなど買い物客が集中する時期に障害が起こると多額の機会損失が発生するでしょう。
先述の顧客満足度にも影響するため、しっかりとシステム監視をおこなって常にサービスを提供できるようにしておくことが重要です。
情シスの工数を削減できる
システムが運用するサービスがダウンした場合、考えられる原因は多岐にわたります。
何の情報もない状態で対処すると工数が増え、復旧にも時間がかかることに。
システム監視をおこなっていれば原因の特定が容易になり、早期の復旧が期待できます。
また、普段からシステムの状態を監視することにより、障害が起こりそうな場所の構成を変更して頑強なシステムに改善することも可能です。
システム監視を行うデメリット
システム監視はメリットばかりではありません。デメリットも把握した上でおこなうようにしてください。
システム監視のスキルを持つ人員が必要
システムを監視するにはそのためのソフトやサービスを利用するだけでなく、正しく活用できるスキルを持つ人員が欠かせません。
たとえば同じログを取得しても、それが何を意味するか理解できれば正しく対処できるのに対し、理解できなければただの宝の持ち腐れです。
このため、場合によってはシステム監視のために新たな人材が必要となるでしょう。
システム監視のための工数・コストが必要
システム監視はすべて自動的に行われるものではなく、監視結果の確認や判断、対処は人間が行わなくてはなりません。
このため、システム監視によってシステム障害発生時の工数は減るかもしれませんが、日常の工数は増える可能性があります。
また、システム監視のための仕組みを自社で1から作り上げるのは難しく、システム監視のためのソフトやサービス導入・運用のためのコストが必要になるでしょう。
システム監視の必要性
初期対応の遅れ
システム監視をしてない場合に、予測ができない障害が発生しシステム停止した際、何が原因でダウンしたか、どこに問題があったのかがわからないと、システムダウンの原因から探すことになり、初期対応が遅れてしまいます。そのことで、サービスや業務に大きな損失が発生する可能性があります。
サーバーダウンなどの障害
システムダウンが発生する原因はいくつかあります。システムダウンがサーバー障害によるものだったとしても、どのサーバーを復旧すればいいのわからなければ、システムの復旧に時間がかかってしまいます。一方、サーバー監視をしていれば、稼働状況をチェックしログを解析することで原因の特定ができ、障害に対する迅速な対応が可能になります。
システム監視・IT監視のアウトソーシングサービス
ここではシステム監視やIT監視のアウトソーシングサービスについて紹介します。対象となるサービスは2021年6月28日時点において「情シスアウトソーシング」で検索し、プライバシーマークやISO27001のいずれかを取得している企業を3つ選出しました。
クロス・ヘッド:情シスSAMURAI
自由度の高い業務内容
クロス・ヘッドのサービスは各クライアントの状況やニーズによって異なる金額・内容で提供されています。中でも情シスSAMURAIではお悩み相談をするアセスメントや回答のみに留まらない情システクニカルサポート、週1回から企業に出向いてサポートを行う業務代行・業務改善などが主要なサービスメニューとなっています。他にもIT資産管理や情シスBPO、セキュリティ対応などあらゆるニーズに対応できる体制が整えて顧客への対応を行っています。
クロス・ヘッドの導入事例
医学論文のオンライン検索システムの安定稼働を狙った導入事例では、開発予定のシステム要件を満たすインフラ基盤の用意が必要な状況であり、既に開発も進んでいることからデータベースの以降も必要、という課題がありました。数年前に一緒に仕事をしたクロス・ヘッドからダイレクトメールが届き、絶妙なタイミングのアプローチを受けたことからすぐに連絡し、インフラ関連の優秀な技術者がいることから依頼しました。現在は無事にAWSへのサービス以降を完了しており、安定したパフォーマンスを実現しています。今後開発を拡大させる場合にもクロス・ヘッドに依頼したいと考えるほど満足いく結果を出しています。
参照:クロス・ヘッド導入事例(https://www.crosshead.co.jp/case/AWS/imp/)
クロス・ヘッドの会社情報
対応エリア | 記載なし |
営業時間 | 記載なし |
電話番号 | 03-4405-7911 |
公式HPURL | https://www.crosshead.co.jp/ |
リップル株式会社:Total IT Helper
コストダウンを実現するプロフェッショナルサービス
Total IT Helperの情シス代行サービスは、クライアントに対する業務のサポートはもちろん、すべての引継ぎ・運営も行うことができるサービスです。IT商社グループとしてのリソースの厚さや緊急時における訪問対応、解決力に特化したノウハウを駆使することにより驚異的なコストパフォーマンスを実現します。顧客の業務がスムーズに進むようサポートを提供した結果、非常に多くの企業でコストダウンを実現するなどさまざまな問題解決を支援し続けています。
リップル株式会社の導入事例
情報システム部がなかった会社に対する事例では、大きいトラブルが発生した際に対応ができず途方にくれている状態となっていました。そこでホームページから問い合わせを入れたところ5分後には連絡が入り、すぐに対応してもらうことで適切な処理を受けることができています。中にはひとり情シスのような立ち回りをしていた事例もあり、困っていた問題に対して情シス代行サービスにより真面目かつ一生懸命なサービスを提供しています。クライアントとしてはインターネットの接続に関するトラブルなど解決が難しいと思っていた内容でも、プロバイダーなどにもコンタクトを取りながらしっかりと時間をかけて訪問対応し、確実な問題解決を実現しています。
参照:リップル株式会社導入事例(https://ithelper.ripple-call.co.jp/case)
リップル株式会社の会社情報
対応エリア | 記載なし |
営業時間 | 平日9:00~18:00(緊急対応可能) |
電話番号 | 0120-890-880 |
公式HPURL | https://ithelper.ripple-call.co.jp/ |
アイチーム株式会社:I team
トータルサポートを提供
アイチームは情シス業務のアウトソーシング・サポートプランを提供していますが、クライアントのニーズに合わせた3パターンのサービス提供を行っています。ヘルプデスクプランでは年間計画策定支援や問い合わせ・設定対応、障がいきり分け・対応などを行います。スタンダードプランではヘルプデスクプランに加え、Windowsアップでとへの対応やソフトウェアupdateへの他央、IT資産棚卸サポートなどを行います。そしてカスタムプランではスタンダードプランの内容に加えて死活・リソース・バックアップなどを含めた監視も行ってくれます。
アイチーム株式会社の導入事例
情シス部門のリソースが薄く、実際に作業を行っているスタッフは1名だけという事例では、おおよそ90名分のPC管理や基幹システムを含むサーバー群が社内外にあるなど膨大な管理業務をこなすことが負担になっていました。アイチームにはアカウント管理やハードウェア管理、セキュリティパッチの対応などIT系の業務全般を委託し、さまざまな相談を行いながら一緒に進めている状況です。一人で対応していると限界がありますが、ハードウェアの故障をアイチームに発見してもらい、大事に至らなかったという事象もありました。他にも一人でやると朝までに終わらなかったような作業がその日のうちに終わらせられるようになるなど、柔軟かつ効率的なメンテナンスができています。
参照:アイチーム株式会社 クライアントインタビュー(https://i-team.co.jp/service/information/interview1)
アイチーム株式会社の会社情報
対応エリア | 記載なし |
営業時間 | 記載なし |
電話番号 | 06-6537-9350 |
公式HPURL | https://ithelper.ripple-call.co.jp/case |
監視ツールの種類
監視ツール
監視ツールとは、ハードウェアやアプリケーション、サービスを監視し、運用結果を報告するために使用されています。インフラストラクチャの監視やIT運用管理(ITOM)ツール、アプリケーションパフォーマンス監視ツール、Webパフォーマンス監視ツールなどの可用性監視ツールなどがあります。
分析ツール
分析ツールは、IT監視ツールなどの監視データを収集し、それをさらに分析するために使用されています。このことで、問題の発生源を特定し、さらに問題の発生原因をつきとめることもできます。AIOpsシステムなどの高度な分析ツールは、過去のパターンや傾向に基づき問題が発生しそうな場所の予測もできます。
エンゲージメントツール
エンゲージメントツールとは、分析ツールと監視ツールの両方で生成された情報を基にして動作するように設計されています。このツールでは、サービスチャットやアラートを管理者に送信するシンプルな動作から、問題のあるハードウェアの再起動やバックアップなどに使用されることもあります。
おすすめのアウトソーシング会社3選
情報セキュリティに関する第三者認定を取得している点に注目し、その上で他にも特徴的なサービスを提供しているアウトソーシング会社を選定し、おすすめしています。
「情シスアウトソーシング」とGoogle検索し、ヒットした上位50ページのサイトのうち、公式サイトが表示された会社28社を調査。そこから、オンサイト対応している、公式サイトに事例を掲載している、プライバシーマークもしくはISO27001を取得している会社からそれぞれ選定して紹介しています。(2024年4月15日調査時点)
情シス業務を引き継げる
本社所在地・対応範囲
所在地 | 東京都港区港南1丁目2番70号 品川シーズンテラス24F |
---|---|
対応 エリア |
日本全国 |
スク
を立ち上げられる
本社所在地・対応範囲
所在地 | 熊本県熊本市中央区辛島町3-20 NBF熊本ビル3階 |
---|---|
対応 エリア |
応相談 |
資産管理まで依頼できる
本社所在地・対応範囲
所在地 | 東京都千代田区大手町一丁目9番2号 大手町フィナンシャルシティ グランキューブ19F |
---|---|
対応 エリア |
記載がありませんでした |