24時間365日安心できる システム運用を支えるエンジニアの仕事
スピードと柔軟性が求められる現代のビジネスにおいて、クラウドサービスの利用率は年々増加しています。サーバのクラウド化によって、ハードウェアの監視こそ不要になったものの、システムの安定稼働には監視・運用が欠かせません。そこで活躍するのが、24時間365日、お客さまのサーバ、そしてシステムを見守り続けるエンジニアたちです。彼らが普段どんな業務を行なっているのか、どんな苦労があるのか。リンクのサポート部で働く栄東逹也さん、仲田和馬さんのお二人に聞きました。
この記事の目次
24時間365日、安心を届けるために
――お二人はお客さまのシステム運用を支える監視運用サービスを担当しているそうですね。どのようなお仕事なのでしょうか?
栄東 私たちはリンクのサポート部で「ベアサポート」というシステム監視サービスを担当しています。ビジネスに不可欠なITシステムですが、必ず何かしらの障害が起きるものです。システムを安定して稼働させるためには、障害が発生したらすぐに検知し、対処しなければいけません。私達はサーバを監視し、エラーを示すアラートを検知したら速やかにお客さまに連絡すると共に、事前にお客さまと取り決めた復旧対応をするというのがメインの業務になります。
仲田 分かりやすい例で言うと、お客さまのWebサイトにシステムエラーが発生したとします。するとアラートが通知されるので、それを手順書に沿って復旧させ、Webサイトが問題なく表示されるようにするのが仕事です。どのタイミングでアラートが出るのかは基本的に予測がつかないため、いつアラートが出てもすぐに対応できるように、24時間365日サポート部のメンバーがお客さまのシステムを監視しています。
――24時間、365日ですか!? 大変な作業ですね。
栄東 お客さまに安心を届けるためにはアラートを見逃すわけにはいきませんから……。朝番と夜番の2交代制で、常にサポート部のメンバーが貼り付いて監視しています。たしかに大変といえば大変ですね(笑)。ただ、以前は会社に出社しての作業だったのですが、コロナ禍で基本的に在宅ワークになったのでずいぶん楽になりました。
仲田 在宅ワーク中でも作業しているメンバーとは、Zoomのような会議システムで常時つながっています。一人ではなく、常に複数で監視しているので何かあったときに相談できるというのは心強いですね。また、病気で休んでしまうと誰かがカバーしなくてはいけないので、普段から体調管理も気にするようにしています。僕と栄東さんが急に休んだことってほとんどないですよね。たぶん二人とも体が丈夫なだけですけど(笑)。
――在宅ワークといっても出社しているのと変わらない環境で作業ができるんですね。元々、お二人はどうして運用監視の仕事に携わりたいと思ったのですか?
仲田 大学で情報系の勉強をしていたのですが、最初はITとは全く関係のない会社に就職しました。でも、やっぱり情報系の仕事に就きたいと思うようになって、転職をしたのがグループ内のパソコンやプリンターの保守をする会社だったんです。そこで保守という仕事に興味を持つようになりました。ハードウェアよりもシステムの方に興味があったのでさらに調べたところ、システムの運用・保守・監視をする専門にするMSP(マネージドサービスプロバイダ※)という業界があることを知りました。システムを正常に運用するためにサポートはなくてはならないものですし、何よりお客さまに安心を届ける仕事だと感じて、5年ほど前にMSPの業界に飛び込みました。それからずっとサポートをやっています。
※サーバやネットワークなどのITインフラやシステムの監視・運用・保守などの管理業務全般を代行する事業者
栄東 私の場合は最初、プログラマーとして開発をしていまして、アプリだったり、セカンドライフという今でいうメタバースのような仮想空間に企業の広告を載せる仕事をしていました。それからシステムを構築するシステムエンジニアを経て、サポートを担当するようになりました。
開発の仕事というのは、基本的にはつくって終わりです。ただ自分がつくったものを安定して稼働させるには、しっかり監視して運用する必要があります。開発をしながらも、その後の運用の部分にもいつかは関わりたいとずっと思っていました。アラートが鳴るとやっぱりドキっとしますし、プレッシャーも感じます。その分復旧できたときの喜びは大きいですし、何よりもお客さまからお礼を言われると、次もがんばろうと疲れも吹き飛びます。
人が見守ることで信頼を提供する
――サーバの監視は監視ツールを活用する会社が多いそうですが、「ベアサポート」では人が監視をしています。これはどうしてですか?
仲田 「ベアサポート」でももちろん監視ツールを使って、自動化できるところは自動化しています。ただ、アラートを検知したからといって、それが本当に障害なのかどうなのかは人じゃないと判断できません。サービスに影響がないのにアラートが出ることもあります。そういう無駄なアラートを減らすために、お客さまと調整して最適な設定を提案して、不要なアラートは減らすのも我々の仕事です。
栄東 自動化だけでは対応できない部分はまだまだあります。お客さんとの会話のなかで、困っていることを聞き出して、新しい問題点を見つけることもあります。会話をしないとお客さまが困っていることを本当に解決することは難しいですよね。
仲田 担当のお客さまも全員がエンジニアではないので、どんな方にでも分かるように伝える能力も求められます。あとは同じアラートでも状況が違う場合もあるので、そこはしっかりと判断して柔軟に対応していかないといけない。これができるのも人が監視しているからこその強みだと思います。
――システム障害が発生したときに心掛けていることはありますか?
栄東 サポート部全体として、まずはお客さまに障害の状況を迅速に知らせるように心掛けています。もちろん復旧対応に取りかかるのですが、復旧対応をしている間にも、お客さまの方で何かできることがあるかもしれません。そのためにもまずはお客さまに知らせることが大事だと思っています。
仲田 お客さまとしても、その先のエンドユーザーさんに報告しなければいけないケースもあるので、とにかくいち早く情報を知らせることはやっぱり大切ですよね。あとは復旧作業では焦らず、正確に手順どおりに対応するのがマストです。障害が発生すると早く復旧しなくてはと急いでしまうのですが、しっかりとチェックすべきところは一人ではなく二人以上で多重チェックすることで間違いを防ぐようにルールとして決めています。
――臨機応変に対応するにはまだまだ人の力が必要ということですね。24時間365日体制で監視をしている理由が分かりました。これまでいろいろな復旧作業をしてきたと思いますが、これは手に負えないといったことはありましたか?
仲田 基本的には決められた復旧手順があるので、手に負えないということはありません。ただ、アプリが原因だと、アプリがどうつくられているのか把握していないと対応が難しい場合があります。とはいってもどこでエラーが起きているのかを明らかにするためには切り分けが重要なので、調べられるところは全部調べて、ハードウェア・OS・ミドルウェアも異常がないので、おそらくアプリが原因になっているというように、こちらの考えをお客さまにお伝えするようにしています。
栄東 どんな事態が起きても対応できるように、普段からいろいろな知識を勉強しておくことも大切です。「ベアサポート」をご利用いただいているお客さまは、リンクが提供している「ベアメタルクラウド」のサーバを利用している方だけではなく、AWSを使っているけれど、監視だけ我々に任せてくださっている方もいらっしゃいます。「ベアメタルクラウド」もAWSもどんどんバージョンアップするので、我々の知識もそれに合わせてバージョンアップしていかないといけない。そこは大変なところでもあるし、新しい技術に触れることができるという意味では、エンジニアにとっては楽しみな部分でもあります。
仲田 やっぱり監視運用という重要な部分を任せていただいているので、これで十分ということはありません。お客さまに安心して仕事を任せられると思ってもらえるように、もっとスキルを上げていきたいですよね。
運用の負担を軽減することでメイン事業に集中してほしい
――システムの安定稼働をどう実現するか悩んでいる方もいらっしゃると思います。そんな方に「ベアサポート」をどのように利用してほしいですか?
栄東 私が開発をしていた頃は「ベアサポート」のようなサービスがあると知らなかったので、開発もしながらシステムの運用も任されていました。アラートが出たら、たとえ夜中でも対応しなければならないので本当に大変でした。
仲田 そうなんですよね。実は開発担当者が運用も任されているケースが本当に多いんです。エンジニアではない人からすると近く見えるかもしれませんが、開発と監視運用はまったく分野が違うので、両方のスキルを持っている人はほとんどいません。今、すごく苦労されている開発担当者がたくさんいると思うので、そこは我々に頼っていただけると嬉しいですよね。
栄東 それぞれ得意分野は違うので、監視運用の部分は私達に任せてもらって、開発担当者は開発に専念してもらうことが、企業にとっても一番のメリットになると思います。私も開発のときに「ベアサポート」があったら、絶対に利用していたと思います。
――では最後にこのインタビューを読んで「ベアサポート」に興味を持った方へメッセージをお願いします。
栄東 安定してシステムを運用していく上では監視・障害対応というのは不可欠なものだと思っています。私たちのサポートは400社以上のサーバ、システム運用でご利用いただいている実績のあるサービスですので、ぜひ、安心してお任せください。
仲田 システムの監視といっても、何が必要なのか、どれくらい費用がかかるのか分からないという方も多いと思います。20年以上にわたりホスティング事業を行ってきたリンクには、これまでのノウハウがありますので、ご要望に合わせたご提案をさせていただきます。まずは気軽にご相談いただければ嬉しいです。