ナビプラス株式会社
いつ発生するか分からないアラートと障害対応オペレーション
ナビプラスはEC事業者向けに、大きく分けて4つのクラウドサービス(SaaS)を提供しています。
NaviPlusレコメンド、NaviPlusサーチ、NaviPlusレビューとNaviPlusリタゲメールですね。NaviPlusレコメンドはECサイトにレコメンド情報を埋め込んで、お客さまのECサイトにお薦め情報を表示させるサービスです。NaviPlusサーチはその名の通り検索エンジンですね、ECサイト内の商品検索エンジンを提供しています。NaviPlusレビューは商品レビュー機能を提供し、リタゲメールは「カゴ落ち」のフォローメールなどを送信するソリューションです。
主にNaviPlusレコメンドのインフラ回りと、他のプロダクトのインフラ回りの支援を担当しています。
NaviPlusが正常に稼働しているかどうか、外形監視を行っています。アプリサーバで正常な結果が返せない場合、リンクのサポート担当に状態を確認してもらい、事象が発生しているようでしたらアプリケーションの再起動といった障害対応オペレーションをお願いしています。
AWSスポットインスタンスも同様に、監視の結果に応じて再起動などをお願いしています。また、その他にもプロダクト間のマスターファイル、アイテムマスターファイルを共通フォーマットに変換させる中間サーバでも監視の結果によって手順対応をお願いしています。
これまでは、社内エンジニアがベストエフォートで障害対応していたのですが、メインとなっていた担当者の退職に伴い、他のエンジニアでの対応を考えました。しかし作業負荷が大きいことから、何かお任せできるサービスがないか探していたところ、監視サービスを提供する企業のセミナーでベアサポートのことを知りました。
はい。以前からさまざまなサービスサイトを見て情報収集をしたり、営業担当にお会いして話を伺ったりしていたのですが、当社は運用しているサーバ台数が多いので、見積もりを取ると月間利用料が大きく膨れ上がってしまいました。ですから、なかなかサービス導入が進まない状況でした。その中で、ベアサポートのマモル インシデントタイプは、サーバ台数は無制限で対応件数ベースの定額利用料のため、当社の状況にマッチしていると考えました。
それほど数は多くないですね。先程お話したケースに限れば、月に5〜6回程度です。
料金プランが台数ベースではなくインシデントベースであること、
エンジニアを採用するコストよりかなり低額であることを高く評価
リンク社を除けば、きちんとお話しをしたのは2社です。どこも基本的に料金体系が台数ベースになっており、運用台数の多い当社ではどうしてもコストが膨らんでしまいます。そうすると、そのサービスを利用する費用対効果として、料金に見合った成果を出すのは非常に難しいという判断になってしまいました。
やはり月間利用料が圧倒的に低コストであることを高く評価しました。月間のインシデント発生件数もマモル インシデントタイプの対応数上限に収まっていましたから、問題ありませんでした。サーバ台数は関係なく月間の対応数に収まっていれば良いので、後から監視対象のサーバを増やしたり対応手順を増やしたりもできますし、まずはスモールスタートで始められるため、当社のビジネスにはマッチしていて経営陣にも提案しやすかったですね。
CTOに話をしました。CTOはもともとインフラエンジニアをやっていたため、「当社のクラウドサービスの場合、インフラ規模に対してのインシデント件数はそう多くないので、対応件数ベースでの料金体系で障害対応オペレーションをお願いできるのであればとても助かりますね」という評価でした。進めやすかったかなという印象はありますね。
以前はいつでも障害対応できるように準備をしていなければならない状態でしたから、エンジニアの心理的な負荷が下がったというところが一番大きいですね
はい、ドキュメントはありました。ただし社内エンジニア用のドキュメントのため、リンクでも対応可能なように、情報を追記してお渡ししています。今大きく3つのことをお願いしているので、ドキュメントも3種類お渡しています。
フォーマット変換サービスの手順対応については、サービス利用開始した後から追加させていただきました。今後も段階的にお願いする障害対応オペレーションを増やしていきたいなと思っています。
Slack連携は非常に助かりましたね。これまで社内で対応してきた際、アラート対応に関してSlackで情報共有していたので。
そもそもフォーマット変換サービスからのアラートメールについては、対象となるサーバが2台あり、どのサーバで問題が発生しているかを特定する必要があります。アラートメールをトリガーとしながらも、その後Slackのメッセージを確認し、サーバを判別するといった少しイレギュラーな対応となるのですが、問題なく対応いただけており助かっています。そして対応完了後も、Slackで「対応しました」というメッセージを出してもらっています。
こちらの運用に合わせて柔軟な対応をしていただくだけでなく、より効率的な運用方法のアドバイスをいただいたりしながら、うまく進めることができたかなと思っております。
自社内のエンジニアはクリエイティブな作業に集中するためにも、障害対応やインフラの構築といった作業は積極的にパートナーにお願いし、変化が激しい時代についていきたいと思います。
少しハードルはあるのですが、できれば他のサービスの障害対応もお任せしたいと思っています。コロナで外部環境が大きく変化する中で、外部に任せるべきところは任せて、自社でやるべきことにリソースをしっかりと割いていく、そしてサービスの改善など開発のスピードを上げていきたいと思います。
会社名 | 株式会社ナビプラス |
---|---|
事業内容 | マーケティングツール事業 |
URL | https://corporate.naviplus.co.jp/ |