
PagerDuty事例:Yelp (Video)
- On 2017年12月7日
- 導入事例Video
Yelpの技術運用部門は、24時間365日の全世界向けの配信システムを担当しています。 Yelp Engineering and Operationsの取締役であるSam Eaton氏は、PagerDutyがどのようにしてチームがグローバルサイトの可用性と顧客満足度を向上させるために役立っているかを語ります。YelpがPagerDutyを使い、どのように問題に最も詳しい最高のエンジニアを結びつけ、すべての国の”follow the sun”サポートシステム(太陽の動きに合わせたような自然なサポート)を自動的に維持しているかを学んでください。
00:03
Yelpでエンジニアリング部門の ディレクターをしている Sam Eatonです
00:08
Yelpは人々を地元の素晴らしいお店と つなげるためのアプリとWebサイトです
00:13
サービス開始から約11年間で32カ国に展開しています
00:16
私のオペレーションチームと インフラストラクチャチームはサイトを
00:19
24時間365日稼働させておくことが任務です
00:23
当社は複数の国にエンジニアとユーザーを 抱えているため、すべてのインフラを
00:29
24時間365日、常に稼働させることが不可欠です
00:35
PagerDutyで、解決に到るまで 非常に助かっています
00:38
サービスについて最も熟知したチームに
00:40
アラートを渡す責任を担ってくれるからです
00:43
そのチームは事態を最も速く収束させられる人々で
00:48
問題をどう素早く収束させるかに 大きな違いをもたらします
00:51
インシデント管理プラットフォームとして PagerDutyを使うことで
00:54
当社のシステムに問題がある場合に 最善の対策が行えます
00:58
世界中の対応できる能力のある人々に 24時間以内に通知されるので
01:03
Webサイトで起こる問題に最速で対処できます
01:07
また インシデントの発生から終焉までの 対応の速さなどの状況を把握して
01:12
インシデント対応のプロセスを 改善し続けられるようになります
01:17
PagerDuty導入の前と後の最大の違いを 1つ挙げると、以前Yelpでは
01:23
インシデントは主にオペレーションチームが 管理していました
01:26
PagerDutyを導入し、特定のサービスを担当するエンジニアリングチームに
01:31
インシデントの第一線のサポートに対する 責任を振ることができています
01:36
PagerDutyによって、インシデント対応能力を分配して 関わるスタッフ全員の協力を促し
01:42
チームメンバーが各自スケジュールや役割を管理して
01:46
適切な人をインシデントに 割り当てることができています
01:49
これはPagerDutyなしではできないことでした
01:51
PagerDutyを使用して 複数の国の オンコールスケジュールを管理しています
01:56
また、フォロー・ザ・サン支援モデルを実現しており
02:00
各国のチームはオーバーライドを 管理するためのオンコール担当者を
02:03
決める自分の役割を管理でき
02:05
さらにPagerDutyによって 適切な人に通知され
02:08
チーム間のエスカレーションが行われ 誰がいつオンコールといった情報のやり取りが
02:13
すべてのチームに渡って 一貫していることを確実にできます
02:17
当社はPagerDutyが大変気に入っています PagerDutyは事態を大幅に簡素化しました
02:22
以前は複雑で手作業で保守され 変更が困難だったシステムを
02:26
オンコールのベストプラクティスに 対応するよう開発された運用に特化した
02:32
一貫した自動化されよく制御された 一連のツールに変え
02:35
組織全体に行き渡らせることで 作業をシンプルにしてくれました
0 Comments