Blog
ブログ

2017年9月17日  (更新日:2022年3月11日)

Summit 2017で発表されたPagerDutyの新機能

ビジネスは事実上ソフトウェアの上で行われるので、デジタルエクスペリエンス の質は組織の成功を左右します。 だからこそ、組織はデジタルの問題を解決するためにビジネス全体のスタッフ全員を動員するのですが、それは数時間、数分ではなく、数秒で動員しなければなりません。

そのため、PagerDuty Summit 2017では、これらのニーズを満たすまったく新しいエキサイティングなプロダクトイノベーションを発表しました。アプリケーションの学習、エンドツーエンドのレスポンスの自動化、およびリアルタイムでビジネス全体の人員動員を統合する新しい機能により、最も重要な場面での非効率をなくし、ビジネスがイノベーションに立ち戻ることに貢献します。

クイックツアーで新しい機能をすべてチェックしてみましょう。

レスポンダー向け:インテリジェントでリアルタイムな意思決定支援

インシデント発生時の不安の最大の原因の1つは、起こっていることを診断するための適切な情報の入手方法を知らないことです。 インフラストラクチャの複雑さとシステムデータの圧倒的な増加は、これをさらに困難にしています。 アラートグループ化、類似のインシデント、及び新しいユーザーエクスペリエンスを備えたPagerDutyは、インシデント発生時、必要な時に正確に提供するシステムとアサインの仕組みをインテリジェントに搭載しています。

アラートのグループ化

問題を冷静に分析しようとしている時に望むことは、電話通知が鳴り続けないようにすることです。 今回、ルールベースの自動化と機械学習によって、関連するアラートが1つのインシデントに自動的にグループ化されるので、レスポンダーは集中的にコンテキストを取得し、問題をトリアージし、応答を開始することができるようになります。

Similar Incidents

マシンデータはインシデントのトリアージ処理を開始する際の中心となりますが、全体像を把握するためには同様の問題を誰が処理したのか、それを解決するためにどのような手順を取ったのかなど、人的情報が必要です。 Similar Incidentsにより、レスポンダーはインシデント優先順位、影響、修復手順など、以前の関連する問題と概要を確認することができます。

ライブインシデントページの再設計

インシデントの影響が大きく、レスポンスが複雑になるにつれ、進行中のすべての状況を把握することが難しくなります。 新しいインシデントページでは、プラットフォーム全体のユーザーエクスペリエンスが大幅に改善されましたた。新しいインシデントページでは、フレッシュなデザイン、リアルタイムの更新、および改善された情報アーキテクチャーによってさらに使いやすさが向上しています。 レスポンダーに対するメリットは、探している情報が容易に発見でき、何が起きているのか最新の見解を常に確認できる点です。 この新しいエクスペリエンスは現在のすべてのプランで利用が可能です。 インシデントが発生した場合、画面の下部にある「Try Something New!」ボタンをクリックしてみてください。

レスポンスチームとツールチェーンオーナーのために:自動精密応答

1分ごとに数千ドルを喪失するようなビジネスを繰り広げている中で、できるだけ迅速にサービスを回復させることが最優先事項となります。 すなわち、可能な限りすべて自動化することで、チームは誰がページを見ているかを調べることなく、問題の解決に集中できるようになります。 新しいイベントとインシデントの自動化により、PagerDutyでのインシデント対応はこれまで以上に高速で、簡単で、正確です。

レスポンスオートメーション

イベントルーティング

複数の場所でビジネスロジックを管理するのは煩わしくて非効率的なだけではなく、可視性が低下し、構成エラーのリスクも高まります。 高度に要求されたイベント管理機能であるイベントルーティングにより、すべてのイベントをPagerDutyに送信し、イベントのペイロードに基づき問題を異なるチームやサービスに自動的にルーティングできます。PagerDutyで定義されたすべてのイベントの自動化により、特定のイベントがどのように処理されるのか一目瞭然です。

Dynamic Notifications

真夜中に目を覚ます必要はありません。異なるイベントではさまざまなレベルの対応が必要ですが、先月リリースされたすべてのスタンダード以上のプランでDynamic Notificationsが利用可能で、イベントデータが通知やエスカレーションに変換される方法をカスタマイズできます。 これにより、大量のアラートによる疲れを減らし、重複したサービスを少なくし、レスポンダーの負荷を軽減します。

組織全体のために:ビジネス全体のオーケストレーションプラクティス

主要なインシデント対応にはITレスポンダーだけでなく、顧客との関係を管理してブランドの評判を保護するために積極的な対策を講じる必要があるなど、ビジネス全体のステークホルダーとの調整も含まれています。 レスポンスは、サポート、カスタマーサクセス、法律やマーケティングなど、さまざまな部門に及んでいます。顧客のエクスペリエンスを保護するという統一目標に、すべてのスタッフを集中させる必要があるからです。

そのため、オープンソースのインシデントレスポンスドキュメンテーションを技術的なレスポンス以上のものに拡張しました 。 これによリ、何千もの最高のオペレーションチームのベストプラクティスに基づくインシデント対応の究極のガイドを活用し、サービスの中断が発生した場合に組織がどのように動くべきかを学ぶことができます。 さらに過去数週間にわたり、PagerDutyのリーダーたちは、 カスタマーサクセスから企業のコミュニケーション方法まで、私たちが日々の仕事でどのようにレスポンスに取り組んでいるか、独自の視点を共有しています。

新しいものを確認する

PagerDutyプラットフォームの最新機能の概要を楽しんでいただければ幸いです。 Dynamic Notifications、新しいインシデントページ、および更新されたレスポンスドキュメントは現在入手可能です。他の機能を誰よりも先に試したい場合は、 こちらからご連絡ください。

※このコンテンツは www.pagerduty.com/blog/の抄訳です。

続きを読む
ニュース&告知
2017年9月1日  (更新日:2022年6月13日)

PagerDutyのスケジュール設定をしてみました

ConfigurationからScheduleを選択します。

「New On-Call Schedule」で新しいスケジュールを追加できます。

まず、 「Time zone」を日本に設定して、Layerを追加していきます。

レイヤーを順番に設定していきます。

レイヤー1では、1人の担当者が日中の時間帯に交互に担当するよう設定してみました。

レイヤー2では、それ以外の時間帯を2名で設定してみました。

最終的なスケジュールは、以下になりました。

簡単なUI操作だけで、柔軟なスケジュール設定ができますね。

また、スケジュールのOverride機能を使うと例外的なスケジュールも組み込むことができるので、非常に便利です。

続きを読む
ベストプラクティス
2017年8月30日  (更新日:2022年6月13日)

インシデントとアラートの違い

インシデントの定義は、 「システムの運用を通して提供されるサービスの中断、サービス品質の低下、 またはその可能性がある出来事」 つまり、「ディスクの使用率があらかじめ決めたしきい値を上回った」等の、 システム利用者には影響がなくても、サービスの品質が落ちる可能性がある出来事もインシデントとなります。

<<インシデントの例>>

■ システム運用者のインシデント

システムが利用できない プリンタで印刷できない アプリケーションのバグが見つかった システム運用監視ツールが発するアラート(警告)

■ コールセンターやヘルプデスクのインシデント

製品に不具合が出たので直したい 業務に必要なデータを書類にまとめてほしい パスワードを忘れたので再発行してほしい アプリケーションの機能を知らないので使用できない

このように障害だけではなく、課題、質問、要望もインシデントに相当します。 突発的な出来事で、迅速な対応が要求され、即座に対応しなければ被害が広がっていくものは全てインシデントとなります。

続きを読む
インシデント&アラート