導入事例:SendGrid

サイズ
従業員数331名

業界
IT&サービス

ロケーション
Boulder, CO

PagerDuty導入
2016年から

課題

  • 以前のアラートツールの置き換え
  • スケーラビリティの問題。テクニカルインシデントの間に何万もの警告を受け取ることができない

ビジネスへの影響

  • ダウンタイム、MTTA、MTTRを削減し、従業員の生産性を向上

PagerDutyのメリット

  • MTTAとMTTRの削減
  • 迅速診断によるダウンタイムの短縮
  • 従業員の生産性と満足度の向上

SendGridはPagerDutyで従業員の生産性を高め、ダウンタイムを短縮します

 

SendGrid

SendGridは、実績のあるクラウドベースのカスタマーコミュニケーションプラットフォームで、毎月250億件を超える電子メールをインターネットおよびモバイルベースの顧客に配信しています。同社はコロラドに本社を構え、従業員300人以上、その内、運営チーム23人、開発グループ約84人を雇用しています。エンジニアリング・オペレーション・マネージャーのMary Moore-Simmons氏は、サーバーとデータセンター、その背後にあるネットワーク、仮想化スタック、およびバックエンドシステムを含むSendGridのインフラストラクチャを管理しています。SendGridから送信される電子メールの割合が高いため、多数のインシデントアラートが毎日生成されます。手動でのインシデントアラートプロセスの合理化と簡素化を支援するスケーラブルなエンタープライズグレードのソリューションを見つけることが、同社の最重要イニシアチブでした。

以前のアラートツールの置き換えとスケーラビリティの課題の克服

SendGridは、典型的に1日最大2000件のインシデントアラートを受信しますが、テクニカルインシデントや停電時には毎分数万件受信します。このように大量になると、アラートを迅速かつ効率的に処理することが重要になります。PagerDutyに移行する前に、SendGridは別のベンダーの製品を使用してアラートを作成していましたが、大量のインシデントをサポートするために本格的なインシデント管理ソリューションが必要であることを認識しました。

「ツールがあればうまく機能してほしいと思うでしょう。特に停電が発生した場合には、そのツールの働きにより期待するはずです」とMoore-Simmons氏は語ります。スケーラビリティの課題に直面したSendGridは、信頼性の高いスケーラブルなインシデント管理ソリューションに移行することに決めました。

新しいインシデント管理プラットフォームに切り替えることでMTTAとMTTRを加速

SendGridはPagerDutyを新しいインシデント管理ソリューションとして実装し、コラボレーション、スケジューリング、エスカレーション、レポートを作成しています。オンコールでは、ユーザーはインシデントアラートを確認したり、必要に応じてエスカレートしたり、すぐに問題を解決したりして、遅滞なく次のインシデントに直接移動することができます。すべてのインシデントを報告するメインダッシュボードは、SendGridのもう一つの重要な利点です。

「PagerDutyのインシデント管理ダッシュボードにより、何が起こっているのか、どのような警告を受け取っているのか容易に確認できます。これは非常に役立ちます – 常にアラートのリストを持ち、それに焦点を当てることはなくなりました」とMoore-Simmons氏は述べています。

Moore-Simmons氏は、PagerDutyの報告機能が彼女の役割にとって最も重要な資産であることを発見しました。メトリックを報告することで、1日、1週間、1カ月、1年あたりのアラート数を分析することができます。

「今年は7万8000件のアラートが発生していますが、2015年に比べてアラート数を50%削減することが目標でした。これまでのところ、PagerDutyのサポートのおかげで、このメトリックを追跡できています」とMoore-Simmons氏は述べています。また、平均MTTR(mean-time-to-repair)は19分で、平均MTTA(mean-time-to-acknowledge)はわずか2分であることがわかりました。これらの情報を収集することで、Moore-Simmons氏と他のエンジニアリングマネージャーの両方が、動作しているものや動作していないもの、問題を解決する方法を特定するのに役立っています。

SendGridの最大のメリットは、信頼性の高い迅速なインシデント通知のおかげで、運用チームと開発チームがすぐに障害を解決し、再発を防ぐことができたことです。停電が発生するたびに、会社には数千ドルのコストがかかり、顧客満足度が低下していましたが、PagerDutyに切り替えた後は、停止回数が減り、より満足と生産性を向上させ、顧客の解約率が低下しました。

従業員の生産性の向上とスケーラビリティの向上

SendGridは、ユースケース、重要なアラート、およびスケジューリングをサポートするための信頼できるソリューションとしてPagerDutyを利用しています。

「PagerDutyのおかげで、不必要に長い停止や収益の損失を心配する必要はありません。SendGridで電話をしている人は皆、PagerDutyを使用しており、このソリューションを確立されたプロバイダとしてPagerDutyを認識しています」とMoore-Simmons氏は述べています。従業員の幸福や生産性はビジネスにとって重要な要素です。PagerDutyに移行した後、迅速な解決時間、従業員の生産性と幸福感の向上、企業の業務効率を証明する印象的なボトム・オブ・ザ・ライン・メトリックを含む多くの利点が見られました。

PagerDutyに関するお問い合わせはお気軽にお寄せください。

お問い合わせ