
PagerDuty事例:Okta (Video)
- On 2017年12月7日
- 導入事例Video
Oktaの技術運用部門担当のTony Stilling氏が、Oktaの100%稼働の達成を支援するPagerDutyについて説明します。
00:03
私はTony Stillingです
00:04
Oktaの技術運用ディレクターで
00:06
Oktaがいつでも使えるように
00:09
サイトを稼働させています
00:12
Oktaはユーザー認証情報を提供する会社で
00:15
個人、企業、デバイスを プラットフォームの種類に関係なく
00:20
その人のデータに結びつけています
00:23
昨年は嬉しいことに 100%の稼働率を維持できました
00:28
PagerDutこそ100%の稼働を可能にし、私が ここにきてからずっと期待に応えてくれています
00:34
障害が起きた場合でも、その原因が特定でき
00:38
可能な限り早くエスカレーションできると 安心していられます
00:41
いつも我々は信頼情報のアップデートを投入すべき場合にサービスをリストアする作業を15分でやるんですが
00:47
Pager Dutyはその作業に 我々ができる限り早く入れるようにし
00:50
15分を使い切ることなく問題に対応できる 適切な人を配置してくれるので
00:55
残り時間をサービスのリストアに使えます
00:57
私が気に入っているもう一つの点はPagerDutyの 分析機能で、今私のサービスやチームが
01:02
どんなインシデントに対応しているのかがわかります
01:05
問題の多い点がサービスのどこにあるのを探し 我々のチームに何が運用負荷をかけていて
01:09
エスカレーションをかけているのかを調べられます
01:13
そこから一つ一つ問題を片付けていけるのです
01:16
PagerDutyには道具としてAnalyticsが備わっています
01:18
開発や顧客サポートチームにも エスカレーションする必要があるような
01:22
大規模障害時などには
01:23
いつもと違うPagerDutyの ローテーション設定を使います
01:26
大規模障害時は我々がレッドアラートと 呼んでいる単一のエスカレーションを
01:30
オペレータが実行できます
01:33
そのプロセスが呼び出されると PagerDuty APIを使い
01:36
異なる複数のチームにエスカレーションをし始めます
01:39
こうして解決やエスカレーションに かかる時間を大きく短縮します
01:43
PagerDutyによって、Oktaのサービスを 非常に高い品質レベルで提供できるため
01:47
とても気に入っています
01:48
どんなシステム障害でも原因を特定でき 不安なくエスカレートできますし
01:53
最高の信頼性と最小限の手間ですみます
01:57
私にとってシステムのライフサイクルを 円滑に回せることがとても大事で
02:02
PagerDutyはそのライフサイクルで 一番大事な役割を担っています
0 Comments