BLOG
PagerDuty AIOpsの紹介:AIの力を利用して企業のモダンオペレーションを変革する

投稿:2023年4月11日   |    更新:2023年4月24日

本日、PagerDuty は、AI の力を活用し、自動化をビルトイン提供し、企業の最新の運用を変革するための会社の基盤データ モデルに基づいて構築する新しい AIOps ソリューションを開始しました。PagerDutyは分散した開発チームが集中できるように長い間ノイズを抑制して支援してきました。現在、PagerDuty AIOpsは、ITOps、Command Centers、NOC、SRE チームが求める大規模なイベントの関連付けと圧縮と自動化のニーズに、Gloval Event Orchestration(既に一般提供を開始)とGlobal Alert Grouping(2023年下半期に EA)で対応しています。Global Alert Groupingの早期アクセスプログラムへの参加に関心がある場合は、こちらからご登録ください。PagerDuty AIOpsは、イベント管理の範疇を超えて、エンドツーエンドのイベント駆動型オートメーションを実行する機能を提供するなど、組織がより効率的に作業できるようにします。

早期アクセスのお客様は、PagerDuty AIOpsを使って、平均87%のノイズ削減、既存のソリューションの9倍の速さの自動インシデント対応の展開、 14 %早いMTTRなどの結果が得られることを既に確認しています。

RiskifiedのテクニカルリードであるKiril Yurovnik氏は次のように述べています。「早期入手プログラムの一環として PagerDutyのGlobal Event Orchestrationを使っていますが、その結果は強力です。Riskifiedは、特に非本番環境からのノイズ削減を強化できたので、私たちのチームは次のイノベーションに費やす貴重な時間を確保できるようになりました。」

みなさんも製品ツアーでPagerDuty AIOpsの動作を確認できます。

PagerDuty AIOpsとは?

PagerDutyプラットフォームのデータによると、イベントの量は前年比で70%増加しています。その結果、企業は対応チームが混沌とした手動の対応プロセスに苦労している間、多くのノイズと労苦に悩まされるようになっています。

また、インシデントの最初の応答者として機能するITOpsチームとSREチームが、システム全体の重要なコンテキストと可視性にアクセスできない場合、次善の策を講じることができません。こうした非効率な運用は、複合的な影響を及ぼします。運用コストが増え、技術組織全体の生産性が低下し、付加価値の高い仕事が奪われます。

リソースに制約のある環境では、チームは 1年かかるような実装は待てず、今すぐ支援が必要です。各組織は、短期間で価値を実現し、既存のシステムと統合し、迅速な ROI を提供するソリューションを探しています。

PagerDuty AIOpsは、各チームがノイズを減らし、効率的にトリアージして解決に向けて適切なアクションを推進し、インシデント対応プロセスから手動の反復作業をなくすのに役立ちます。PagerDuty AIOpsは、長期間かかる実装や重い継続的メンテナンスを必要とせずに、すぐに使えます。各組織は、クラス最高の結果を引き続き得られます。ユーザーの行動に基づいて学習し適応するMLモデルに組み込まれたノイズリダクションは、チームが目にするインシデントが少なくて済むことを意味します。また、エンドツーエンドのイベント駆動型のオートメーションにより、解決が迅速になり、本来は付加価値の高い作業に携わるべき人からの入力を要求することが少なくて済みます。

「PagerDutyのGlobal Event Orchestrationを活用することは、イベントルーティングプロセスを効率的でスケーラブルにして、IT運用と支出を最適化するために不可欠です。「Global Event Orchestrationにより、当社の組織は通知から「resolved」の状態を検出して解決済みとして実行し、これらの状態を設定する必要がある場所の数を少なくとも3分の1に減らせます。これにより、設定作業ではなくイノベーションに集中する時間を確保できます。」

PagerDuty AIOpsに含まれるものは次のとおりです。

  • イベント相関、ノイズ圧縮、トリアージ コンテキスト機能により、サイトの信頼性エンジニアと情報技術チームは、複数のベンダーや手動プロセスの管理から解放され、単一の強力なソリューションで迅速に解決に向かえるようになります。
  • イベントの取り込みから自動修復までのエンドツーエンドの自動化により、価値を破壊するインシデントになる前に重要なイベントを捕捉して対処することで、チームが事後対応型から予防型に移行できるようにします。。
  • サービス全体でアラートをグループ化し、顧客が定義済みのルールと機械学習の両方を活用して重要なインシデントのみを浮かび上がらせるようにする、高度なノイズ リダクション機能(早期アクセスプログラムで利用可能)。
  • ビジネス、IT、財務に広範囲に影響を与える重大インシデントが発生する前に、全インシデントを監視して迅速に管理するための、信頼できる唯一の情報源を運用チームに提供する可視化コンソール。
  • Global Event Orchestration。強力な意思決定エンジンであり、ルーティングを強化・制御したり、自己修復アクションをトリガーしたりします。
  • PagerDuty Operations Cloudプラットフォームでの700以上のインテグレーションにより、各チームは自動化可能で人間中心のAIOpsソリューションを信頼して、時間とお金を節約できます。

PagerDuty AIOpsはどう機能しますか?

PagerDuty AIOpsには、各組織が全チームとサービスにわたって最良のインシデント対応方法を標準化しスケールさせるのに役立つ一連の機能があります。また、ITOps、Command Centers、NOC、SRE チームにサービスを提供するためにカスタム構築された新機能が付属しています。

ノイズインシデントの削減:ボタンをクリックするだけで、Global Alert Groupingを使って、サービス内またはサービス全体でインシデントのノイズを削減できます。組み込みのMLモデルを使うほかに、独自のロジックを作れます。また、インテリジェントML とルールベースのアラートグルーピングを組み合わせて、カスタマイズ可能なグループ化機能を実現します。コンテンツ・時間・組織のニーズに合ったノイズ削減のためのその他の基準によってアラートをグループ化します。

image1.gif

トリアージ時間を短縮し、アクションを促す: ML を活用して、レスポンダーにとって最も重要な情報を即座に明らかにします。インシデントが発生した場合、レスポンダーは、インシデントの推定原因、インシデントが以前に発生したかどうか、変更が原因である可能性が高いかどうかを迅速に発見できます。

image4.gif

冗長な作業を自動化: イベントオーケストレーションの強力な意思決定エンジンを活用して、Global Event Orchestrationを備えたPagerDuty内で、特定または全サービスのイベント条件に基づいて、ルーティングを強化および制御したり、自己修復アクションをトリガーしたりします。

image3-1536x1277.png

重要なことを可視化する: サービス全体の運用体制の包括的なビューを提供するカスタムダッシュボードを作成します。さらに、イベント データを完全に可視化できるため、取り込まれて処理されるものに優先順位を付け、イベントの使用状況を完全に把握できます。

image2.gif

PagerDuty AIOpsを今すぐ始めるにはどうすればよいですか?

現在PagerDutyのProfessionalまたはBusinessプランをご利用のお客様は、アカウントのサブスクリプションメニューでPagerDuty AIOpsをセルフサービスで購入できます。

Event Intelligenceのお客様は、PagerDuty AIOpsで利用可能な新機能にアクセスするための移行オプションについてアカウント チームにお問い合わせください。詳細については、ナレッジベースの記事をご覧ください。

現在PagerDutyを利用中でも、これから始めようとしている場合でも、トライアルを申し込むか、製品ツアーに参加することで、PagerDuty AIOpsの動作を確認できます。ご質問があれば、こちらからお問い合わせください。


この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。