24/365とは? システムを安定稼働させる運用・保守業務のポイントと課題
近年、あらゆるビジネスにおいてIT化は欠かせないものとなっています。WebサービスやECなど、休日・深夜問わずビジネスが可能になった反面、システムを常時安定稼働させる必要性が増しています。システム障害などのトラブルが発生した場合には、機会損失だけでなく社会的なイメージや信用までも低下させかねません。このような事態を防ぐには、システムを24時間365日体制で常時監視する必要があります。本記事では、24/365運用の概要とシステムの安定稼働のために実施すべきこと、課題やアウトソースするメリットについて解説します。
この記事の目次
24/365とは
「24/365」(24365、24・365)とは、24時間365日のことです。システムの運用・保守業務においてよく使われる言葉で、24/365運用とはシステムを24時間365日安定稼働させることを表します。システム障害はいつ発生するかわからないため、24時間365日体制で常時監視し、対応する必要があります。
業務システムの場合は社員が利用する平日日中時間帯だけ稼働していれば問題ないかもしれません。ですが、インターネットで公開しているWebサイトや、BtoCのWebサービスなどはむしろ休日や夜間の方が利用されるでしょう。顧客に提供しているシステムで障害が発生すればサービス提供がストップしてしまい、売上の損失や信用の低下につながりかねません。障害の検知が遅れるほど影響範囲が広がってしまうこともあり、復旧までの時間がかかれば損害が大きくなる傾向にあります。そのため、特にWebサービスなどを提供している企業にとっては、24/365体制でシステムの運用・保守業務を行うことは必須といえるのです。
システムを安定稼働させるための運用・保守業務
システムを安定稼働させるために必要な運用・保守業務について具体的に解説します。
システム監視
システムを構成するサーバー、ネットワーク、アプリケーションなどが正常に稼働しているか常時監視します。もし障害が発生した際には迅速に検知できるよう、必要な監視項目の洗い出しやアラートとして通知するトリガーを適切に設定することが重要です。CPU・メモリ・ストレージといったリソースの不足が障害を引き起こす場合もあるため、リソースの使用状況やパフォーマンスを監視することで、増強が必要であるかを判断することにも役立ちます。
障害対応
システムのトラブルを検知した場合、迅速に対応し解決する必要があります。システムの性質や規模、対応するメンバーの体制によって異なりますが、一般的な障害発生時の対応の流れは以下の通りです。
まず監視システムが発報したアラートを担当者が受信し、内容を確認します。アラートの内容に応じて、事前に対応手順が定められている場合はそれに沿って対応します。それでも復旧しない場合や、未知の障害だった場合は上級のエンジニアへエスカレーションを行います。大規模な障害の場合は、影響範囲と状況を確認し、関係者への連絡も必要となるでしょう。復旧作業完了後には、状況を整理して障害の原因調査や今後の再発防止策などを検討することも重要です。
セキュリティ対策
近年ではますます企業を狙うサイバー攻撃が活発化しており、システムの安定稼働のためにはセキュリティ対策も欠かせません。アクセス制限などのネットワークセキュリティだけでなく、公開しているWebサーバーに対するWAFやIDS/IPSといったセキュリティ対策ソリューションの導入・運用、OS・ミドルウェア・アプリケーションの脆弱性対応など、システムを健全な状態に保ちサイバー攻撃から身を守るには、多くの対応が必要となります。
バックアップ対応
障害や人為的ミスなどによってデータが損失することを防ぐには、定期的にバックアップを取得しておく必要があります。データベースに保存されたデータや、共有フォルダに保存されたファイルをバックアップするデータバックアップを行います。それに加え、OSからアプリケーションなどを含むシステムを丸ごとバックアップするシステムバックアップも取得しておけば、復旧をよりスムーズに行えるでしょう。
システム改善
現行システムが持つ課題を分析し、可用性・信頼性・耐障害性の向上に向けた改善を行います。リソースの増強やパフォーマンスチューニングなど、システムの処理効率を上げることを目指す作業です。システムのアップデートなど、定期的なメンテナンス作業も含まれます。
24/365運用・保守業務を自社で行う場合の課題
自社で24/365運用・保守を行う場合、機密性を保ちやすいことや運用以外の業務も担当できることがメリットです。しかしその反面デメリットも多いため、ここでは課題となる点を具体的に解説します。
人的リソース・ノウハウ不足
IT人材はあらゆる業界で求められており、慢性的に不足しているのが現状です。特に最近は人材確保がより難しくなっています。
人件費・教育費の負担
24/365運用を行うには、一般的な1日8時間・月20日程度の勤務時間で考えると、最低でも5人程度は必要になるでしょう。自社内で5人以上の運用担当者を抱えることは採用・教育コストを含め、大きな負担となることが予想されます。
離職率の増加
24/365運用は休日・夜間を問わない不規則な勤務形態です。担当者の負担は非常に大きく、離職につながりやすい傾向があります。もし欠員が出た場合は人員を補充するため迅速に採用活動を行わなければなりません。新たな採用・教育が必要になる度にコストや工数が発生し、負担となるでしょう。
24/365運用・保守業務をアウトソースするメリット
自社運用の課題を解決する手段として、24/365の運用・保守業務を専任業者へアウトソースすることも有効です。具体的なメリットについて解説します。
コア業務に専念できる
自社のシステム担当者が24/365体制の監視業務から解放されます。実際に障害が起きることは少なかったとしても、「いつ起きるかわからない」状態で備えていなければいけない状況は大きなストレスとなります。そうした心理的負荷も無くすことで、本来取り組むべき社内のDX推進やIT戦略立案、サービスの企画・開発といったコアな業務に注力できるようになれば、企業全体としての生産性向上や業務効率化が期待できるでしょう。
障害発生時の早期対応
ベストエフォートではなく、24/365での監視体制や障害発生時のマニュアルやノウハウが整っているため、障害が休日・深夜などに発生した場合でも迅速な対応が可能です。早期対応により、システムのダウンタイムを最小限に抑えられます。企業の損害や機会損失を防ぎ、ビジネスへの影響を軽減できることは大きなメリットです。
運用コストの削減
自社で24/365体制を組む場合の人件費や教育費と比較すると、アウトソースする方がコストを削減できる可能性が高いです。専任業者は豊富な知識や経験を備えたチームのため、高品質で安定したサービスが期待できます。24/365体制を組まずに自社エンジニアのベストエフォートで対応している場合も、障害発生時の損害や自社エンジニアへの負担を考慮すると、有効な投資であると考えられるでしょう。
「ベアサポート」は、24/365体制でお客さまシステムの監視・障害対応を代行いたします。監視ツールからのアラート通知を代行受信し対応する「マモル インシデントタイプ」は、システムのインフラがどこにあっても、サーバー/インスタンスが何台あっても、月間50対応まで定額でご利用いただけます。
- 自社で24/365体制を抱える場合のコスト : 月間250万円〜(人件費)
- マモル インシデントタイプの利用料 : 月額15万円(サービス利用料)
まとめ
企業にとってシステムを安定稼働させることは、今や社会的な信頼にもつながります。そのためには24/365体制でシステムを常時監視することが欠かせませんが、自社で行うには多くの課題が存在します。これらの課題を解決する手段として、運用・保守業務をアウトソースすることは非常に有効です。専任業者のサービスを利用することで、より安定したシステムの運用ができ、自社エンジニアの負荷を減らしたりコア業務に専念できたりとメリットは大きいでしょう。ぜひ運用・保守業務のアウトソースを検討してみてはいかがでしょうか。
「ベアサポート」では、監視運用の代行だけではなく、インフラの初期構築や監視設計・導入、セキュリティソリューションの導入・運用なども可能なため、インフラ運用に関することは何でも相談可能です。ITインフラに関する課題をお持ちであれば、ぜひお気軽にご相談ください。