Case Study
GROUPON

EコマースのWebサイトGrouponは地元企業に協力してその認知を高め、新しい顧客を獲得する手助けをします。シカゴに拠点を置く同社は大成功を収め「Groupon first check」というフレーズ通りに人気を博しています。

成長が複雑性をもたらす

5年間で、Grouponは世界最大の商業プラットフォームの1つになっています。Grouponは世界中の6万5000以上の商店主と協力し、20万以上のアクティブなグローバル取引を行っています。48カ国で事業を展開しており、そのチャネルは拡大を続け、商店主や消費者に役立つプロダクトを革新的技術を用いて開発しています。しかし、同社の成功はPagerDutyが解決するまでいくつかの非効率的な運用をもたらしました。

Grouponのプラットフォームは企業と消費者の両方に関係しているため、常に高可用性のレベルで機能する必要があります。同社のサイト信頼性エンジニアリング(SRE)チームは、問題が発生した場合の停止通知を中心とした内部SLAを持っていましたが、社内のインシデント管理ワークフローには依然として内部的な複雑さがあり、SREがサポートしているグループだけでなく、New Relicなどの広く使用されている商用プロダクトなど複数のツールを使用してアプリケーションを監視していました。

NOCからSREへ

Connie-Lynne Villani氏(Grouponシニアマネージャー)は、より良い方法を追い求めました。NOC(Network Operation Center)のバックグラウンドをもつConnie-Lynne氏は、Grouponのソリューションの信頼性とパフォーマンスを向上させることに重点を置いたプリベンション・オリエンテッド(予防指向)なチームを構築することを決めました。SREは、開発者と緊密に協力してシス​​テムの設計、構築、保守を行う構想を練りました。この計画の重要な部分は、24×7オンコールローテーションに参加し、問題が発生したときに対応することでした。

Connie-Lynne氏はGrouponに参加する前にPagerDutyのことを知っていて、通知を微調整してアラートノイズを減らすことができるかどうかを確認することにしました。

PagerDutyはどのように役立ったか?

PagerDutyは、Connie-Lynne氏の両方の目標を首尾よく達成しました。現在、電子メールのアラートを受信するだけでなく、SREでサポートされているチームには音声、SMS、プッシュ通知が送信されます。複数の通知はGrouponのシカゴオフィスのチームにとって理想的です。彼らは貧弱な携帯電話の受信能力に悩まされていました。シカゴのエンジニアは通知を常に受け取るために固定電話も追加しました。

「PagerDutyは、従業員にリアルタイムで通知を届けるために、測定された方法を開発者にわかりやすく提供することを可能にしました」

PagerDutyはユーザーがカスタマイズすることもできます。SREはユーザーの連絡先を設定する役割を担いません。現在、SREでサポートされているすべての人々は、自分のアラート設定を変更することができ、世界中の多くのオフィスでGrouponの運用管理を合理化しています。PagerDutyがツールキットの一部になる前は、適切な人々に通知することは大いなるチャレンジであったため、障害が発生した時のSREに対する要求は特に深刻でした。

「PagerDutyは業務効率を推し進める決定打でした」とConnie-Lynne氏は言います。

「現在では連絡経路の問題から開放され、他のプロジェクトに集中する時間が増えています」

PagerDutyの強力な統合機能により、Grouponの運用プロセスがさらに強化されました。NagiosアラートはPagerDuty内でフィルタリングされ、アラートノイズが減少します。誰もが処理の輪の中に居られるよう、PagerDutyはチャットツールHipChatと統合され、インシデント状態の更新を促進します。

アラートフィルタリング機能は、GrouponにPagerDutyを採用させた理由なのかもしれませんが、PagerDutyのユーザレベルのアラート管理が最大の影響を与えています。Connie-Lynne氏はGrouponのオンコール文化にかなりの影響を与えていると報告しています。

「PagerDutyは隠された宝物でした。PagerDutyは、いつ、どこへ、どのように通知するかを自由に決めることができます」

GROUPON

従業員数: 11,200 +

業種: テクノロジー

所在地: Chicago, IL

取引期間: 2012年から