Blog
ブログ

2022年3月21日  (更新日:2022年9月13日)

今こそ、その先へ。Arrayの進化

Words Like Freedom

There are words like Freedom   フリーダムなんて言葉がある

Sweet and wonderful to say   口にすると甘く素敵な響き

On my heartstrings freedom sings   琴線に触れる自由の歌の数々

All day every day.   毎日毎日耳にする。

There are words like Liberty   リバティなんて言葉がある

That almost make me cry   聞けば泣きそうになる

If you had known what I know   僕のことを知っていれば

You would know why.   なぜだか分かるよね

Langston Hughes

(訳注:Freedomは束縛からの自由、Libertyは行動する自由)

初日、4年前 2018年2月15日(木)、私たちの新年最初のタウンホールで、私は同じブラックデュートニアン(訳注:デュートニアンはPagerDuty社員という意味)のAdam Booneと共に立ち、Langston Hughesの詩「Words like Freedom」から上記の言葉を全社に読み上げました。その日、私たちはPagerDutyで初めてのブラック&ラテン系従業員リソースグループ(ERG)であるArrayを紹介しました。今思えば、入社してまだ2カ月目、このステージでマイクを握らされ、私たちの声を聞いてもらう機会を与えられたのですから、緊張しました。アメリカでキャリアを積んできた黒人女性として、マイクを渡され、心から発言することを許されたときほど嬉しいことはないでしょう。これこそ、私が言うところの「リバティ」です。この場に至るまで、何の障壁もなく、日時を指定されたので、ただ来て、始めたのです。この時、PagerDutyではこういう仕事ができるんだと思いました。

PagerDutyのおかげで、インクルージョン、ダイバーシティー、エクイティーに関して、私たち全員が果たすべき役割を理解することができました。私の経験を通じて、Arrayの旅について、そして私たちが1カ月のお祝いを超えて、私たちの周りの人々(ブラック、ラテン、そして味方)を育てるための継続的なプログラミングに移行していることをお話ししましょう。この物語の一部では、私が働いている職場で、帰属意識と公平性のある場をつくるためにERGというプラットフォームをどのように利用したかを紹介しています。

振り返り

私が初めてPagerDutyに来たとき、多くの有色人種がそうであるように、ここに「私たち」が何人いるか数えてみたんです。幸いなことに、私が前にいた場所よりも多かったので、言うまでもなく、私は興奮しました。他の黒人やラテン系のデュートニアンに出会い、一緒にランチを食べたり、会議室でERGの名前、ミッション、ビジョンについてブレストしたりして、すぐにここPagerDutyでのコミュニティー意識を持ったことを覚えています。 Arrayのミッションは、ブラック&ラテンアメリカの生きた経験への共感と理解を育む、継続的な学びのコミュニティーを可能にすることです。 ビジョン:PagerDutyの多様で包括的なグローバル職場環境を育成・賞賛することで、黒人・ラテン系従業員の活躍の場を均等にし、多様な顧客層を代表する人材を継続的に獲得すること。

私は、「これは、私の祖先が公民権運動を計画していたときに経験したことなの?」と考えました。可能性はありますね。PagerDutyでの時間を振り返ってみると、最も長く在籍しているArrayリーダーとして、Arrayは私とPagerDutyに多くのものを与えてくれました。私たちは、どのような不快な会話が交わされる可能性があるかを共に学び、私たちに直接影響を与える難しい社会問題を解決するために、黒人とラテン系の従業員に自分のスペースを持つことを許可し、味方のために黒人とラテン系の経験を知ってもらうための学習機会を作りました。

私たちは先の長いゲームに参加しています

昨年、未来の働き方を研究する中で、カリフォルニア大学バークレー校のOthering & Belonging Instituteのディレクター、John Powell から”universal belonging”(普遍的貴族意識)という言葉を学びました。普遍的帰属意識とは、人々の間にある一体感や感覚のことです。意見、人種、信条、階級、宗教の違いに関係なく、人々を結びつける感覚です。多くのArrayのメンバーが去っていきましたが、私はArrayの中で過ごした時間と経験によって、私たちがどのようにこれからの仕事を生き抜いていくのか、そして、分散した世界の中で分離された私たちが帰属の場を作るにはどのような仕事が必要なのかを理解できました。パンデミックや危機は自己満足している時ではないことを、私はArrayの進化を通して学びました。

PagerDutyの価値観である”Bring Your Self”、”Take the Lead”、”Run Together”によって、Arrayは成長し、一体感がより重要視されるようになりました。長年にわたり、私たちはPagerDutyでこの一体感を作り出し、他の人たちを連れてくることを許可され、特権を与えられてきました。

私たちは、人種についていつ話すべきか、いつ話すことができるか、また、私たちが誰であるかを認めあえるかについて、暦上の月に左右されるわけにはいきません。実際、歴史を祝う日や月があっても、過去を消し去ることはできませんし、現在そして将来にわたって私たちが直面する問題を解決することはできません。この4年間、私はArrayのリーダーシップ、会員数、プログラムへの参加、イベントへの参加などの成長を目の当たりにしてきましたが、それは私たちが取ってきたゆっくりと進む行動によるものでした。そして、2022年。Arrayのメンバーは90人を超え、Arrayの中に「Array-Black」と「Array-Latine」というサブグループを作り、それぞれのディアスポラに対してユニークな体験を提供できるようにしています。私たちは、「黒人歴史月間」「ヒスパニック・ヘリテージ月間」の枠を超え、つながりや成長、コミュニティ形成を促進する継続的なプログラムを通じて、つながりや変化をもたらすことを目標としています。また、昨年は初めて”Inclusion Survey”のデータの報告を受け、会員のニーズに対応したプログラムやイベントを実施するための参考としました。 会員数が増え、データが蓄積されたことで、他の優れたチームと同じように、私たちも進化と拡大を遂げることができるようになりました。私たちは、黒人やラテン系の人材が職場でより良い未来を実現できるよう、周囲に影響を与えることで歴史を刻んでいきたいと考えています。元の状態に戻るよりも、より公平に私たち全員のためになるニューノーマルに到達できるのでしょうか?

変革にはリーダーシップが必要

真の変革には、説明責任と、それを実行しようとする真のリーダーが必要です。ArrayがERGになった直後、CEOのJennifer Tejadaは、Arrayのリーダーとじっくりと話をしたいと言ってきました。その姿は、今でも鮮明に覚えています。彼女は部屋に入ってきて、座って、"私に何ができるのか "と言ったのです。それがきっかけで、あとは歴史に残ることになりました。それ以来、ArrayはCEOとつながり、関係を築き、Alec Gallimore、Elena Gomez、Bonita Stewartといった黒人とラテン系のボードメンバーにアクセスできるようになり、Arrayメンバーとシニアリーダーによる初のERG主催のメンターシッププログラムを始めるためのスポンサーとなり、ビジネスと社員体験というレンズを通してメンバーが直面しているさまざまな課題にどう取り組むかを意識させることができるようになったのです。Jennの魅力は、Arrayのことに関して答えを知っているふりをすることなく、四半期ごとのアップデートミーティングでは時間をかけて話を聞き、解決策を見つけるサポートを惜しまないことです。

未来への展望-コミュニティーの構築

パンデミックの「ジュニアイヤー(訳注:アメリカの高校は4年制で、ジュニアイヤーは3年目に当たる)」だと聞いています。私が高校生の頃を思い出すと、3年生といえば、高校卒業後の進路について真剣に考える年でした。ある意味、今日のArrayは、私たちの将来について真剣に考え、帰属意識を持てるようなPagerDutyのコミュニティーの強さを構築しているのです。私は、リーダーたちがアイデアを持ち寄り、それを実現することで、コミュニティー内での定着率とエンゲージメントを高めることにコミットしていることに、とても興奮しています。このような継続的なつながりがあれば、誰もが毎日仕事に打ち込み、お互いのため、お客様のためにベストを尽くすことができるようになると信じています。今年、私たちは以下のような形で、継続的なコミュニティづくりを推進しています。

不快な会話につなげる。**私たちは、会話には力があると信じているからこそ、「Spill the Tea」の対話を続けています。このようなメンバー同士の親密な会話は、自分自身を表現し、今一番気になっていることについて本音で語り合うための安全な場となります。毎月1回開催し、組織横断的にメンバー同士が気軽にぶつかり合える場を設けています。 アライメンバーとリーダーをつなぐ。**このプログラムは、シニアリーダーシップチーム(SLT)のメンバーが、黒人と茶色のデュトニアンのキャリアを発展させるための指導を行い、同時に、職場内外の黒人と茶色のコミュニティをサポートするためのアライシップのベストプラクティスを学ぶために企画されたもので、2年目に突入しています。また、職場の内外で黒人や褐色人種のコミュニティーを支援するためのアライシップのベストプラクティスを学ぶこともできます。 このプログラムは、私に「ドリームビッグ!」という自信を与えてくれました。 私は素晴らしい指導者に恵まれました。彼は、私に自分の考えを話す時間を十分に与えてくれました。彼は私の話に耳を傾けるだけでなく、聞き、自分の個人的な話をすることで私と弱さを共有し、何でも可能であることを教えてくれたのです。 —2021 Array mentee, Meley Bekele

Arrayメンバー同士をつなぐ。**会員数の増加に伴い、「Reach One, Teach One(ROTO)」シリーズを開始します。このシリーズでは、会員を対象としたアンケートの結果をもとに、行動を起こしていきたいと考えています。会員の皆さんは、キャリアの節目や決断をどのように乗り越えたらよいかを話し合う場を求めていました。このような会話を始めるには、自分のコミュニティー内で行うのが一番良い場合もあります。私たちは、隔月でこのセッションを開催しています。 トピックを1つ選び、視点、アドバイス、洞察を共有します(一部のトピックは会員のリクエストに応じます)。 プロセスに関する実用的なヒントを提供します。 前に進むための意識を高めるために、本音で語り合い、厳しい質問をする安全な空間を作ります。 より大きな目的へとつながる。**私たちは、先人たちの犠牲なくして、このような機会を得ることはできなかったと認識しています。今年も、ID&Eチームとソーシャルインパクトチームとのパートナーシップを維持し、社員とコミュニティーのために時間を割くことを徹底していきます。2月と9月・10月には、黒人系とラテン系企業の声を意図的に増幅させ、それぞれのヘリテージを祝いました。今後も、大小さまざまな取り組みを通じて恩返しをし、あらゆる面で周囲の人々を高めていけるよう、努力を続けていきます。過去および現在のパートナーシップは以下の通りです。 Days for Change Code Tenderloin MLK Middle School, San Francisco Women’s Building, San Francisco The New Georgia Project Atlanta Mission Covenant house of Georgia Empowr Atlanta Community Food Bank Continue To Have Hope for the Future

未来に希望を持ち続けること なぜなら、変化とは最終目的地ではなく、正義であるからです。年々、私たちは意識と認識を高め、プログラミングを繰り返し、一度に一人ずつに影響を与えることを学ぶ意欲を持つようになることが、私の望みです。Arrayは、私たちが誰であるか、どのように他者に影響を与えるか、そして人々を第一に考えたときにどのような変化が起こりうるのか、その見本となるにはどうしたらよいか、私たち全員が学ぶべきことがあると教えてくれました。真の自由と解放は、すべての人が意志を持ち、ひとつの人間として学ぶことを許されているときにのみ訪れるのです。Arrayは、その学びのプロセスを支援できると思います。私は、過去と現在のArrayのメンバーが、長年にわたり、個人的、職業的な経験や物語を私と共有してくれたことに、永遠に感謝します。そのような体験談や経験が受け入れられ、今日のArrayのコミュニティーの核となっているのです。

What Makes Array

No two stories the same   同じ物語は2つとない A mix of melanin we call by name   私たちが名前で呼ぶメラニンの混合物 A space for an unfiltered tone   素直なトーンのための空間 A community I can call home.   私が故郷と呼べるコミュニティー。 Filled with pride and emotion   誇りと感動で満たされる I don’t feel like a token   私はつまらないものだとは思っていない Always there on a day like today   今日のような日にいつもそこにいる Moving us forward, this is Array   私たちを前進させる、これがArray

—Phylicia Jones この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

続きを読む
ベストプラクティス
2022年2月15日  (更新日:2022年9月13日)

PagerDuty、新たなフィランソロピーパートナーとともに不公平を是正し、気候変動への対応に取り組む

PagerDutyは2年前にPagerDuty.org Fundを立ち上げ、タイムクリティカルヘルスの分野で資金調達し、より早く人々に届けることで命を救う手助けをするという使命を担いました。それ以来、世界はCOVID-19のパンデミックによる広範囲な影響と、人種的不公平に対する報いを受けました。このパンデミックの長期的な遺恨は、公衆衛生システムにおける構造的な不公平をさらに悪化させることです。これを受けて、PagerDutyは2021年、世界中の最も疎外されたコミュニティーへのワクチン配布に注力する団体のために100万ドルの資金、製品、技術サポートを調達しました。

私たちの世界、私たちが目指すもの

制度的差別と闘うために、私たちは健康格差に取り組む活動を、構造的人種差別の影響を受ける別の分野、すなわち気候変動と環境汚染の影響にも広げています。異常気象が私たちの日常生活や幸福に影響を及ぼすようになり、気候変動が私たちのコミュニティーの健康にもたらす害が明らかになってきました。これらの変化は私たち全員に影響を与えますが、最も被害を受けるのは、最も貧しい人々なのです。特に、パンデミックへの対応で見られた健康上の不公平は、人種、階級、性別による不平等が根強く、多くのグループが環境災害や気候変動の影響に対してより脆弱であることを映し出すものであります。有色人種、低所得者層、先住民族が、水質汚染や大気汚染、有害物質による被害を不当に受けていることを示す研究は増え続けています。レッドライン(訳注:経済面での人種差別)は50年以上前に禁止されましたが、その影響は今日も有色人種社会を苦しめています。歴史的にレッドラインのある地域は、レッドラインのない地域よりも気温が高く、木や緑地が少ないのです。さらに、これらの人々は、気候変動から最も深刻な被害を受ける可能性が高く、熱波、洪水、山火事、その他の異常気象の影響に備え、再起する能力が最も低いのです。

この不公平の中心にある根本的な原因である有色人種コミュニティーへの投資不足に取り組むためには、全ての人々、特に汚染と気候変動の影響を不当に、そして制度的に受けている人々の有意義な関与を中心とした環境正義のビジョンに焦点を当てる必要があります。この限られた機会に、私たちはより公平な未来を再構築しなければなりません。私たちは、環境危機の影響にレッドラインを引かない、社会的に公正なアプローチを必要としているのです。最も疎外された人々が環境災害や気候変動の影響、さらには新たな健康上の脅威から確実に保護されるようにするには、協力的かつ体系的なアプローチが必要です。

気候変動に関するフィランソロピーの分野を調査したところ、別の不公平があることが分かりました。気候変動に焦点を当てた資金提供者からの資金のうち、環境正義に取り組むBIPOC(訳注:黒人・先住民・有色人種)主導の団体に向けられたのはわずか1.3%でした。この不均衡から、Donors of Color NetworkはClimate Funders Justice Pledgeを作成し、全米最大の気候変動資金提供者に、より透明性を高め、気候変動資金の少なくとも30%をBIPOC主導の第一線のグループに展開することを公的に約束するよう求めました。

未来の世界的指導者への投資

公平性を高めるという目標のもと、私たちは全ての資金提供の取り組みにおいて、多様な指導者や有色人種のコミュニティーに力を与える組織への支援を意図的に行ってきました。PagerDuty.orgは、女性やBIPOCの指導者がいる組織への投資の歴史を踏まえ、環境と気候の正義に向けて活動する4つの組織に、合計25万ドルの無制限資金を投入します。これらの組織は全てBIPOCのエグゼクティブディレクターが率い、国内、地域、および国際的なコミュニティー主導の運動の一部を担っています。より公正な未来を擁護するためにオープンソーステクノロジーを使用している組織もあります。これらのパートナーは以下の通りです。

Earth Guardiansは世界中の環境、気候、社会正義の運動において力を発揮する指導者となるべく青少年を育成し、力を与えています。6大陸で数千人の若者が活動しており、Earth Guardiansは彼らの声とコミュニティーへの影響を増幅させるためのプラットフォーム、リソース、そしてつながりを持つ機会を提供しています。音楽、アート、文化を通じて、あるいは気候変動ストライキや集会を組織して、Earth Guardiansのユースリーダーは再生可能な未来を想像するよう、他の人々を鼓舞しているのです。

「組織は転換期を迎えました。1992年の設立以来、40歳以下のBIPOC女性が先導を務めるのは初めてのことです。PagerDuty.orgはEarth Guardianの転換期と活動を公的に支援してくださり、感謝しています。この寄付により、私たちはアート、ストーリーテリング、組織化、法的措置を使って力強い変化を生み出すために、若者のエンパワーメントを直接支援することができ、同時に私たちがグローバルコミュニティーとして直面している重要な問題に対するインパクトのある解決策を鼓舞していきます。」

-Catherine Mongella, Executive Director, Earth Guardians

Earth Hackのインクルージョンについてのビジョンは、世代間や多国間のつながりが生まれ、学生たちが環境活動の一形態としてハッカソンに参加するグローバルコミュニティーです。これまでのハッカソンでは、都市部のヒートアイランドなど不公平な問題の解決に取り組んできました。歴史的な差別的慣習であるレッドラインに起因する有色人種のコミュニティーに不釣り合いな影響を与える問題です。ハッカソンのイノベーション能力を活用し、オープンソースプロジェクトライブラリーは、何千人もの大学生が批判的思考に取り組み、潜在的な解決策を得るための出発点として役立っているのです。

「Earth Hacksは、PagerDuty.org Fundの寛大なご支援により、ハッカソンを環境活動の一形態として活用する私たちの活動を支援できることに感謝しています。この助成金により、例年よりも多くの学生を支援し、小さくても意味のある環境ソリューションの組み合わせを推進し、環境技術分野における正義に焦点を当てた文化の変化を促進し続けることができます。」

-Sanjana Paul, Co-Founder and Executive Director, Earth Hacks

OpenAQは、個人とコミュニティーをオープンデータでつなぎ、科学を発展させ、政策に影響を与え、大気汚染と戦う力を人々に与えることを使命とする非営利団体です。OpenAQ Platformは、世界最大のオープンソース大気質データプラットフォームであり、世界135カ国からの160億のデータポイントを集約・調和し、毎月1500万件のデータリクエストに対応しています。OpenAQ Platformは、よりきれいな空気のための世界的、地域的、ローカルなアクションを支える基盤として機能しています。また、多様なステークホルダーを集め、よりクリーンな空気のための公平なソリューションを触媒として、データ設計と行動計画を共同で開発しています。

「OpenAQは、PageDuty.orgの助成金を受けられることに感激しています。このパートナーシップによる支援は、きれいな空気を実現するためにデータへのアクセスがもはや障害とならない世界というOpenAQのビジョンをよりよく実現するために役立ちます。私たちは、大気質の低下に最も影響を受ける人々が大気質のデータにアクセスしやすくし、よりきれいな空気のための解決策をともに検討しようとオープンデータの力を利用する大気質の支持者を団結させることができるでしょう。」

– Chisato Fukuda Calvert, Interim Director, OpenAQ

The Solutions Project(TSP)は、全米の黒人、先住民、移民、女性、有色人種が主導する組織が生み出した気候正義の解決策に資金を提供し増幅する公的財団です。2021年、TSPは127の草の根団体に1000万ドルを助成し、助成対象に100万ドルのコミュニケーション能力開発を提供しました。これにより、石油生産の段階的廃止からパイプラインの阻止、風力タービンや電気自動車製造の開発、コミュニティーの太陽光発電や水システムの構築まで、目覚ましい成果を生み出しました。

「この運動は、多数の問題に同時に取り組む気候正義の解決策を現場で作り出している草の根組織とさらに協力するよう、フィランソロピーに求めているのです。TSPは、誰もが手頃な価格の住宅、環境に優しい良い仕事、資源への公平なアクセスを持つ世界を思い描いています。私たちがここに到達する唯一の方法は、最前線のコミュニティーと連帯して動くことです。PagerDutyのような業界のリーダーが、気候正義へのこの道を認識してくれることをうれしく思います。」

-Gloria Walton, CEO of The Solutions Project

COVID-19の大流行がもたらしたポジティブな結果のひとつは、資金提供パートナーに資金提供のスピードと柔軟性を高めるよう促したことです。PagerDuty.orgはこの点で確立された前例に倣い、私たちの助成金を使途不指定の資金として構成し、これらの組織が適切と考えるようにそのミッションを推進できるようにしています。また、PagerDutyの従業員、具体的には従業員リソースグループのリーダー、ソーシャルインパクトアンバサダーカウンシル、そして最も熱心な環境保護活動家たちが、私たちの選考プロセスに意見を述べ、私たちの決定に役立つ多くの多様な視点を提供してくれたことに感謝しています。

支援・奨励

パートナーの1団体であるEarth Guardiansが示しているように、若者主導の気候変動運動は、フィランソロピーにこの緊急事態に対応するよう働きかけています。パートナーから得た洞察と学習は、制度的差別に対処するアプローチを進化させるために、私たちの戦略に反映され続けます。私たちは、これらの優れた団体を支援できることを光栄に思うとともに、全ての人間と地球の健康を守るためのこの取り組みに参加される仲間が増えることを願っています。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

続きを読む
ベストプラクティス
2022年1月18日  (更新日:2022年9月13日)

非インテリジェントなスウォームをコントロールしてインシデント対応を改善しよう

事件が起こる。物事がうまくいかない。システムが故障する。時には、予期しない劇的な方法で失敗し、重大な事故が発生することもあります。PagerDutyは、1つのインシデントとインシデントを非常に明確に区別しています。あなたの組織でもそのような区別をしているかもしれません。 (訳注:太字は重大インシデント、斜体は些細なインシデントという意味)

インシデントが重大かどうかの判断は、影響を受けるサービスの数、顧客への影響、インシデントの期間など、多くの要因、または特定の要因の組み合わせによって決まります。

これらの要素には、少なくともベースラインの遠隔測定と、技術エコシステムを構成するサービス間の関係性の把握が必要です。このベースラインがなければ、インシデントのトリアージにおいて、実際の影響やどこから手をつければよいかを知ることは困難です。

重要なデータがない場合、どうなるのでしょうか?次のようなデータがないと、インシデントに対応するのが難しくなります。

どのサービスが影響を受けるか どのサービスにどの程度の影響があるか そのサービスのオーナーは誰か

このようなデータがない場合、インシデント対応にスウォームアプローチを選択する組織もあります。

スウォーミングとインテリジェントスウォーミングの比較

スウォーミングとは、組織内の全員に問題が発生したことを知らせ、問題解決に貢献できる可能性の有無に関わらず、全員が参加できる大規模なウォールームや電話会議を開くインシデント対応のアプローチです。インシデントの影響を軽減するためには、適切な人材を適切なタイミングで動員することが極めて重要です。スウォーミングは、適切な人が適切な時間に適切な場所にいることとは正反対で、全員がずっと参加することです。

インテリジェントスウォーミングという言葉は、今月初めにお話しした、特にVIP向けの接客対応ワークフローを指す言葉として使われています。これはやや異なるアプローチで、最初にケースを拾ったチームメンバーが解決まで見届けることを指定し、問題解決を支援するために組織内のリソースを引き込む能力を持つものです。一般的なレスポンススウォームと関連しますが、インテリジェントスウォームの焦点は通常、単一の顧客であり、その体験を中心に据えることです。

一般的なテクニカルインシデント対応のためのスウォームは、建物の火災報知器のように、全員が厳戒態勢で対応することが期待されています。基本的には、何らかの知識を持つ可能性のある人全てにアラートが送信され、インシデントに参加するよう求められ、その後、誰がトリアージと修復を行えるかを見極める手間のかかるプロセスが開始されます。

組織はしばしば、自社のサービスやエコシステムについて十分な情報を持っていなかったり、ステークホルダーに情報を提供するための強力なコミュニケーション手段を持ち合わせていないために、群れをなしてしまうことがあります。何かが起こったとき、何が問題なのか、どこで起こっているのか、誰がどうすれば解決できるのか、誰も分からりません。だから、自分が何か重要な知識を持っているかもしれないと、誰もが動員されます。このため、スウォーミングは非常にコストがかかります。仕事は中断され、タスクやミーティングは頓挫し、リソースは有効でない場所に取り残されることになります。ほんの一握りだけが実際に対処できるインシデントへの対応のために、本来は障害にならない範囲で作業を続けて適切なアップデートを受け取れるはずの何百人もの人が動員されてしまうかもしれません。

スウォーミングアップも大変です。多くのレスポンダーがいる大規模な通報は、騒がしくて混乱することがあります。スウォーミングは、明確な調整や責任の所在が不明確なため、インシデントの復旧プロセスを遅らせることになります。中央の組織や意思決定権がない中で、あらゆる方向から情報が入ってきます。チームは、他のサービスへの影響を十分に理解しないまま、自分たちのサービスを復旧させようとするかもしれません。スウォーミングアップは、私たちがインシデントコマンドを明示的に実践している理由の一つです。混乱を減らし、事態を悪化させることなく、できるだけ早くインシデントを解決するためです。

スウォーミングは、自分たちのシステムが影響を受けていると判断された時点で人員を投入するのではなく、最初の警告からインシデントコールに必要な人員を常に配置できるとチームが考えているため、安心感があります。オンコール体制を改善することで、復旧に人員を割けないのではないかという不安を取り除くことができます。オンコールのローテーションを明確にし、責任分担を決めておくことは、いつオンコールの連絡が来るか分からないと心配するよりも、レスポンダーのストレスが軽減されるのです。レスポンダーは、特定の日や時間帯にオンコールシフトがあることを知っていれば、前もって計画を立てることができます。群発シナリオでは、必要な人材が不在になる可能性があります。彼らは24時間365日オンコールで対応できるわけではありません。

スウォームからの移行

スウォーミングからプロセスを改善するには、サービスとそれを所有するチームについてのチームの考え方を変える必要があります。PagerDutyでは、この実践を「フルサービスオーナーシップ」と呼んでおり、これについてはOpsガイドで詳しく説明しています。連携したインシデント対応という文脈では、サービスの所有権はいくつかのことを意味します。

1つのチームが、本番環境でのパフォーマンスを含め、そのサービスに対する全責任を持っている。 そのチームには、そのサービスに関する問題が通知されるための文書化されたプロセスがある。一般に、これはオンコールスケジュール。 そのサービスが消費する依存関係が文書化されている。

あなたの組織には、現在、明確なオーナーがいないサービスがあるかもしれません。それらは、もはや積極的な開発や注意を払う必要のない成熟したプロジェクトやレガシープロジェクトかもしれません。ベンダーと共同で保守している“棚から出してすぐ使える商品”(COTS製品)、SaaSソリューション、あるいは組織の変更で孤立した内部サービスかもしれません。サービスが本番環境の中にある場合は、ベンダーのアップデートを受信するためにチームの電子メールエイリアスを登録するだけでも、サービスを監視するチームを作る必要があります。あなたの環境で稼働している全てのサービスには、明確に責任を負うチームが必要です。これらのサービスは、インシデントに巻き込まれたり、セキュリティー更新などの作業を必要としたりする可能性がまだあります。組織によっては、レガシーエンジニアリングチームやプラットフォームエンジニアリングチームが、これらのサービスの責任者になっている場合もあります。

サービスを1つのチームに割り当てることで、環境内で誰が何を所有するのかに関する混乱を減らせます。チームは、自分が所有するサービスについて新しいメンバーを教育し、最も影響力のあるサービスのSLOに管理できます。サービスディレクトリーを作り、誰に通知すべきかを記載したチームのオーナーシップの構造を補うことで、組織内の全員に、問題が発生したときに相談できるリソースを提供するできます。PagerDutyでは、チームとエスカレーションポリシーをサービスに添付することで、これを実現しています。

エスカレーションポリシーは、サービス上のインシデントに対応するために、誰が利用可能だと期待されるかのガイドラインを設定します。この場合のレスポンダーは、影響を受けるサービスに精通し、問題のトリアージと修正を行うための適切なアクセス権を持つ人物であるべきです。

明確な依存関係モデルは、サービス間の関係を確立し、レスポンダー、サポート、ステークホルダーが、あるサービスでの事故が環境内の他のサービスにどのような影響を与えるかについて明確に把握できるようにします。PagerDutyはさらに一歩進んで、ビジネスサービスを提供し、技術サービスを互いにリンクさせるだけでなく、それらが貢献する顧客向け機能にもリンクさせます。全ての技術サービスとビジネスサービスは、サービスグラフに表示され、そのサービスのために現在オンコールしているチームメンバーへの便利なリンクも表示されます。

このインフラデータ(特に依存関係モデル)を構築することは、あるサービスに対して最新の状態に保たれていない場合、多くの労力を要することになります。しかし、バックエンドのサービスに対するインシデントの影響を完全に把握することは、その問題が発生しているサービスを消費している他のサービスが分からなければ不可能です。

カスタマーサポートチームも、この作業から利益を得ることができます。インテリジェントスウォーミングは、サポートチームがこれらの情報を全て手元に置いておけるかどうかにかかっています。顧客が解決策を必要とするとき、チームは全ての正しい情報を見つけ、適切な人材を動員できなければなりません。

インシデントコミュニケーションの改善

インシデント対応は、観客を楽しませるスポーツではありません。チェックやプロセスの実行を待ち、エラーメッセージを追跡し、再起動を待つ時間が長くなることがあります。この作業が行われている間は、あまり変化がありません。しかし、これらの作業が進行している間でも、修復に直接関与していない人々は、何が起こっているのかを知りたがります。強力なインシデントコミュニケーションプランがないことも、チームがスウォーミングに頼る理由の一つです。もし誰かが何が起こっているのか知りたければ、解決にどんなに時間がかかっても、コールに参加して聞くしかないのです。

重要なインシデントのための強力なコミュニケーションプランをあらかじめ決めておくことは、内部ユーザーが何が起こっているのかを常に把握できるようにすることと、外部ユーザーに情報を提供することの2つの機能を備えています。インシデント対応ガイドでは、インシデント発生時のコミュニケーションについて、「顧客リエゾン」と「社内リエゾン」いう2つの役割を明記しています。この2つのグループには、それぞれ異なるアップデートを行うことが予想されます。組織によっては、インシデントについて公表する内容を検討したり、特定の表現を使ったりする必要があります。そのため、テンプレートを作成し、特定のチームメンバーをコミュニケーション担当として任命することで、この作業を容易にします。社内向けには、他のチームが自分たちのサービスに影響があるかどうかを判断できるように、より詳細な情報を提供することになるでしょう。

最良の計画は、全てのステークホルダーに定期的に情報を提供することを前提にしています。早めに、そして頻繁にコミュニケーションすることで、状況が改善され、問題が解決されたときに、全員に知らせることができます。

NOCで群れる必要はない

第一線のレスポンダーが総合的な担当をするNOCチームである場合、最新のインシデント対応モデルに移行できます。サービスオーナーシップを明確にしていれば、NOCがインシデントを解決できない場合、複雑な問題をサービスチームにエスカレーションできます。サービスAを担当するチームのオンコール中のレスポンダーを呼び出すことは、組織全体からさまざまな人を集めるよりもはるかに簡単です。

まとめ

対応方法を近代化することで、組織の時間とリソースを節約できます。SAPのようなPagerDutyの顧客は、必要なときに必要なレスポンダーだけを動員し、最も効果的な対応を提供することに集中できるという利点を享受しています。

もし、あなたのチームが解決までの時間を短縮し、大規模なスウォームコールの必要を抑制する方法をお探しなら、当社のインシデントレスポンス運用ガイドのリソースをご覧ください。フルサービスオーナーシップを実現するために必要なことは何でしょうか?当社のビデオをご覧になり、コミュニティーフォーラムで同じ考えを持つ人々と話し合ってみてください。

この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

続きを読む
ベストプラクティス
2022年1月27日  (更新日:2022年9月13日)

インテリジェントアラートグループのタイトルのつけ方

共著者:PagerDutyデータサイエンティストVI、Chris Bonnell氏

引き続き、IAG(Intelligent Alert Grouping)の活用・改善方法について、第3回目をお届けします。最初の投稿では、インテリジェントアラートグループ化機能を紹介しました(こちら)。2回目の投稿では、IAGがどのようにマージを使用してアラートをグループ化するのかを説明しました(こちら)。本日は、IAGのマッチングを向上させるためにアラートタイトルを使う方法について説明します。

アラートタイトルが表示される場所 - 再確認

アラートがプラットフォームでトリガーされると、eメール、テキスト、またはアプリ自体からのプッシュ通知など、いくつかの経路で通知が行われることがあります。どの経路であっても、表示される最小限の情報は、アラート番号、サービス、およびアラートタイトルです。これは、いくつかの注目すべき場所に表示されます。アラートの受信方法によっては、これらの一部または全部が見慣れたものかもしれません。緊急度レベル(例:高)は、連絡方法を決定するために使用されますが、目に見える形で表示されないことに注意してください(ただし、インシデントの詳細には表示されます)。

電話のプッシュ通知とテキスト通知

例えば、iPhoneのロック画面を見てみましょう(同じインシデントについてのテキストメッセージ通知や電話着信)。

これはブログ投稿のために全てのチャンネルにアラートをプッシュしています。ここでは、アラートのタイトル、番号、サービスが表示されていることが分かります。テキストメッセージも似たような感じです。

メール通知

これらは少し違っているように見えます。メールの件名にはあまり詳細が書かれていませんが、メッセージの本文にはアラートの詳細が記載されています。

なぜ、アラートタイトルの表示場所を見直すのですか?

私のような方なら、実際の状況やサービスに関するアラートタイトルや説明文を書いていたときは、人間の脳に最適化させていたのではないでしょうか。証拠は上にも表れています。このアラートタイトルはブログ記事のタイトルのようだし、文頭に「Title」という識別子を強引に含んで、それが表示される場所を強調しています。これは人間のためのもの。読者の皆さんが画像から情報を読み取る際に、私が特定の部分に注目してもらいたくて故意にやりました。

もし、人間以外のために設計するとしたら?例えば、機械学習に適した設計ならどうでしょう?機械学習について知っていることや学んだことを何でも取り込み、それらを活用しようとメッセージを歪め始めるでしょう。

私が皆さんにお伝えしたいのは、このことです。インテリジェントアラートグループの体験を向上させるために機械学習を取り入れる際にも、人間のことを念頭に置く必要があるということです。

アラートタイトルを活用する

人のためにアラートタイトルを構築するとき、忘れてはならないことがあります。

簡潔であること。ご覧の通り、プッシュ通知もテキスト通知も文字数制限が短いです。 OSやウェブブラウザーによって制限が異なります。例えば、Androidの場合、プッシュするタイトルの文字数制限は65文字で、さらに説明文の文字数制限は240文字です。iOSの場合は、タイトルと説明文を合わせて178文字となっています。

明確であること。タイトルが分かりにくくなったり、何も伝わらなかったりするほど簡潔であってはなりません。 タイトル欄を優先するあまり、他の欄をおろそかにしないこと。 ウェブインターフェイスと同様に、PagerDutyモバイルアプリでは、他のインシデント、そのサービス、その説明を含む完全なインシデント情報を利用することができます。最初に表示されるからといって、タイトルフィールドに情報を盛り込みすぎないでください。

これらの詳細については、インシデントレスポンス運用ガイドの「アラート発信の原則」のページをご覧ください。

機械学習では、以下のことに注意しましょう。

識別性と頻度を上手に利用する。 データモデルは(人間と同じようには)読むことができない。 データモデルは意図を推論することができない。

その理由は、機械が「自然言語処理」と呼ばれるものをどのように行っているかを理解するためです。自然言語処理とは、スペルチェックや文法チェッカーが「it's」と「its」を区別して著者に通知したり、オートコレクトがどの単語と活用、どの形式(活用、自然下降)を提案するかを知るためのものです。アラートタイトルに適用される自然言語処理では、タイトルを匿名化し(詳細は後述)、「文トークン化」と「単語トークン化」というプロセスでそれぞれ文と単語に分解し、単語を見出し語化(レンマ化)して、最終結果を頻度の決定と他のアラートとの相関性の検索に使用します。

匿名化から始めると、例えば特定のIPアドレスをxx.xx.xxに置き換えるように、そうでなければあまりにも一意な情報をその情報のパターンに置き換えることが目的です。このテキストは、一意な情報によって本来関連するはずのタイトルが関連しなくなることを防ぎます。関連する可能性のあるコンテキストが完全に削除されるわけではありません。レンマ化とは、活用語や屈折変化をレンマと呼ばれる基本形に単純化する工程のことです。再び例で説明します。{“dogs”, “dog’s”, “dogs’”, “dog”}は全て“dog”にレンマ化され、同様に{“is”, “are”, “be”, “were”}は”be”にレンマ化されます。つまり、“The dog's bones.”と“The dogs' bones.”のような文は、この段階でどちらも{“the”, “dog”, “bone”, “.”}にレンマ化されるのです。

この時点で、インテリジェントアラートグループモデルは、N-gram(N個の単語のグループ)とインシデント言語のパターンに関する知識の両方を使用して、アラートタイトルから情報を抽出し、意味のある相関関係を作成します。前回の記事で紹介した例をもう一度見てみましょう。

最初のパターン memory usage high (> N %) on server $NAME in region $REGION 2つ目のパターン memory usage on host is high (> N %)

既にN %と$NAMEで少し匿名化しましたが、これらのタイトルにあるものをトークン化する練習をしてみましょう。 トークン化、レンマ化された最初のパターン。 {“memory”, “use”, “high”, “(“, “>”, “N”, “%”, “)”, “on”, “server”, “$NAME”, “in”, “region”, “$REGION”} トークン化、レンマ化された第2パターン。 {“memory”, “use”, “on”, “host”, “be”, “high”, “(“, “>”, “N”, “%”, “)”}

パターンが意味することの影響を考えると、2番目のアラートでは、そこに置かれた値によって変化する唯一の用語はNです。もし閾値が現在のメモリー使用量ではなく、一貫したものであれば、Nは全く変化しないか、タイトルに表示される値が1つか2つしかない可能性があります。それに対して、最初のアラートのタイトルには、サーバー名とその地域の一意性がより強くなっています。つまり、用語は1つまたは全く変化しないのではなく、3つの変化する用語があるわけです。言語処理装置に関する限り、2番目のパターンのアラートは1番目のパターンよりも相関関係がある可能性がはるかに高いです。

これからの方向性

アラートのタイトルを作成する際には、人間と機械学習の両方を考慮することが重要です。人間はアラートやインシデントの詳細情報を利用して追加のコンテキストや情報を得ることができますが、インテリジェントアラートグループではタイトルフィールドのみを使用するため、機械学習の最適化を若干意識するとよいでしょう。自然言語処理の基本については、Towards Data Scienceブログの「Introduction to Natural Language Processing for Text」ブログ記事をご覧ください。一般的にアラートやインシデントに含めるべき情報についてのベストプラクティスは、当社のインシデントレスポンス運用ガイドをご覧ください。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

続きを読む
インシデント&アラート
2022年1月25日  (更新日:2022年9月13日)

PagerDutyは、従業員の健康を第一に考えています

PagerDutyは、育児休暇と従業員の健康増進のために、業界をリードするプログラムを導入したことを誇りに思っています。従業員とともに、全てのデュートニアン(訳注:PagerDuty社員をDutonianと呼んでいます)のために健康で幸せな職場を築くことを約束します。

業界をリードする育児休業制度

最新のPagerDuty Inclusion, Diversity, and Equity Annual Reportによると、社員の約30%が親または介護者であることが判明しています。グローバルな育児休暇制度であるBabyDutyを通じて、私たちは手厚い有給休暇を提供しており、多くの場合、最低限必要な条件以上のものを用意しています。例えば

米国**:妊娠中の両親は最大22週間、養父母など妊娠していない両親は最大12週間の有給育児休暇を取得できます。 カナダ**:妊娠中の両親は最大22週間、養父母など妊娠していない両親には12週間の有給育児休暇を取得できます。カナダ雇用保険と連携しています。また、カナダで義務づけられている育児休暇の残りの期間については、無給で休暇を取得できます。

2022年に新たに段階的な職場復帰ポリシーを導入し、初めて育児をする従業員には、再びフルタイムになる前に最大4週間の短時間勤務での復職オプションを提供します。1日の労働時間や1週間の勤務日数を50%から75%相当に減らすことができ、職場復帰をしやすくなります。

さらに、有給育児休暇期間中の基本給以上の給与をカバーするために、制度を拡充しています。この新しい制度の意図は、ボーナスやコミッションの対象となる従業員を経済的に補填することです。

両親や家族をサポートする

子育てには大勢の力が必要なため、従業員のコミュニティーも拡大しています。育児に伴う多くの義務を全うできるように、従業員はCleoとCare.comに会員登録し、特典を利用できます。

Cleoを通じて、健康、育児、およびキャリアのニーズをサポートする専任のスペシャリストが従業員につき、ストレスを軽減しながら育児をできるようになります。 Care.comを使用すると、従業員は認定されたチャイルドケアプロバイダーの幅広いネットワークにアクセスできます。 米国とカナダの従業員は、バックアップケアを利用することもできます。これは、年間5日間の助成されたチャイルドケアの補償範囲です。 「パンデミック(世界的大流行)の時期に親であることは、特に近くに家族がいない場合、大変なことです。今年の初めにシッターが病気で休んだとき、1日だけなら何とかなりましたが、1週間の休みが必要となったとき、大慌てしました。PagerDutyのバックアップケアを試してみることにしました。Care.comは2時間以内に認証済みのシッターを割り当ててくれ、翌朝に到着してからその週の残りをカバーしてもらえました。こんなに簡単だとは信じられませんでした。」-Karen、PagerDutyシニアプログラムマネージャー

充電の時間

COVID-19が大流行した際、社内のウェルビーイング調査を通じて、社員がストレスを感じており、仕事以外の自分の時間を十分に確保できていないことが分かりました。

その結果を受けて即座にDutonian Wellness Daysを設定しました。これは、他の有給休暇や祝日に加え、社員が仕事以外の時間を楽しむための全社的な有給休暇です。全社的な休暇は、PagerDutyにとって新しいものではありません。数年前、私たちは会社の伝統であるHibernationDuty(冬眠当番)を通じて、会社全体が同時に休暇を取ることに大きなメリットがあることを知りました。年末のHibernationDutyでは、社員は1週間の休暇を楽しみ、会社は少人数のカバレッジチームで運営されます。この期間、社員はメールや仕事が溜まっていることを気にすることなく、完全に切り離すことができるのです。

Dutonian Wellness DaysとHibernationDutyの成功により、今年初めて有給の真夏のWellness Weekを提供できることを誇りに思います。私たちは、従業員が十分に休息することで、毎日の「Champion the Customer」が可能になると考えています。

ウェルビーイング施策の導入以来、レジリエンススコア(頻繁に従業員満足度を測定しています)の好感度が25ポイントも上昇しました。これらの結果と従業員からの圧倒的な好意的なフィードバックに基づき、私たちは従業員の健康に投資し、この変化を企業文化の一部として定着させたのです。

従業員の経済的負担を軽減する

従業員にとって報酬は重要であり、個人的なものですが、このような不透明な時代においてはなおさらです。将来の資金計画に関連するプレッシャーを軽減するため、退職金制度を充実させました。

米国では2022年に、従業員の401k退職金制度へのマッチング拠出を1%から2%に引き上げました。現在、PagerDutyは、従業員の在籍中、給与期間ごとに最大2%まで401kプランの拠出金と同額を拠出することになっています。カナダの従業員については、PagerDuty DPSPへの会社からのマッチング拠出を増やしたことをお知らせします。2022年1月1日より、RRSPに拠出された適格利益1ドルにつき、PagerDutyはDPSPに1ドル、最大2%まで拠出します。

さらに、一部のプランでは、米国における免責金額と医療費自己負担額の上限を引き下げました。PPO(Preferred Provider Organization)プランでは、プランや階層に応じて自己負担額の上限が500ドルから1,000ドルの間で引き下げられました。HDHP(High Deductible Health Plan)の控除額は、プランの階層によって300ドルから600ドルの間で減少し、雇用主のHSA(Health Savings Account)拠出は月々最大225ドルとなっています。

PagerDutyは社員を大切にします

私たちは、社員が日々、当社の製品とサービスを向上させるために貢献していることに感謝しています。私たち全員が前進し、新たな課題が発生したときでも、従業員の声に耳を傾け、世界レベルの従業員体験を提供するために努力を続けていきます。

この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

続きを読む
ニュース&告知
2022年3月17日  (更新日:2022年9月13日)

ギャップを埋める:正しい方法で自動化を導入する

企業における自動化は新しいことではありません。エンジニアは何十年も前から自動化ツールやフレームワークを使って仕事をしてきました。構成管理ツール、継続的インテグレーションとデリバリーパイプライン、クラウドの形成など、自動化はビジネスシーンにおけるほぼ全ての技術的なユースケースの構成要素となっています。こうしたことが本当なら、なぜ自動化はいまだに多くの手作業と対になっているのでしょうか。

その答えは?IT部門とそれ以外の部門に自動化を広く普及させるには、まだ明らかな遅れがあるのです。例えば、今日の企業の大半は、製品、サービス、ヘルプデスク、その他の顧客向けアプリケーションなど、何らかの形でデジタルサービスを提供しています。そして、ほとんどの企業は、そのサービス提供の展開や維持のために、IT組織内である程度の自動化を活用しています。しかし、自動化は利用されていても、その価値が十分に発揮されていないことがよくあります。自動化の利用は通常、ビジネスの小さな領域に限定され、自動化を実装または構築した従業員のみがそれを使用し適用することができます。

私たちはこれをオートメーションギャップと呼んでいます。

オートメーションギャップ オートメーションギャップとは、組織内の自動化の利用が島ごとに存在し、各専門業務部門がサイロ化した自動化を活用しているというシナリオです。さらに、オートメーションギャップがあるということは、(専門家以外の)ほとんどの従業員が、自動化を実際に利用するための系統的な知識、スキルセット、組織全体のアクセス権を有していないことを意味します。

ITの視点から見ると、オートメーションギャップは業務を停滞させ、次のような大きなビジネス上の問題につながる可能性があります。

専門家へのエスカレーションが絶えず、イノベーション能力が制限される SLAペナルティーとインシデント解決の遅れによるエラー率の増加 予定外の仕事や依頼が殺到し、専門家が燃え尽きる 最終的には顧客の不満と収益の損失につながる

デジタル世界における技術革新のスピードと消費者の期待の高まりを考慮すると、オートメーションギャップがもたらす負の外部性は、日が経つにつれて悪化または拡大する一方でしょう。しかし、問題に対処し、ギャップを埋める前に、ギャップの存在の根本的な要因を特定し、理解できるようにする必要があります。

オートメーションギャップの特徴は、大きく3つの要素に分類されます。 ナレッジギャップ スキルギャップ アクセスギャップ

ナレッジギャップ あらゆる規模のデジタルファーストの組織は、顧客のニーズを満たし、イノベーションに歩調を合わせ、競争に勝ち残るために、常に変革を続けなければなりません。この進化を成功に導くためには、デジタルインフラも並行して適応し、進化していく必要があります。しかし、進化は一夜にして起こるものではありません。進化は、何年にもわたるDX、従業員や文化の変遷、新たな複雑性や技術的な依存関係を経て、レガシーインフラの上で発生するものなのです。適切な文書化と理解なしには、シームレスな実行はほぼ不可能です。

ナレッジギャップとは、1人の個人または社員が、IT組織内のあらゆる依存関係、システム、ベストプラクティスについて、専門家になれるわけではないことを理解することです。例えば5年以上勤続している元社員は、レガシーインフラのインシデントに取り組むための系統的な知識を持っているかもしれませんが、8カ月勤務しているオンコール対応者は、同じ基礎インフラについて微妙な理解を持っていないかもしれません。

スキルギャップ スキルギャップとは、ユーザーによって技術的なスキルセットが異なるという現実のことです。ナレッジギャップと同様に、スキルギャップも組織のデジタルインフラ全体における新しいテクノロジーと複雑性を専門に扱う従業員に起因しています。新しいシステムやプロセスが導入されると、多くの場合、それらを構築または実装した専門家 (SME)が、必然的にインシデントが発生したときに問題を適切にトリアージできる唯一の人物となります。このような専門性のボトルネックは、対応のライフサイクルに悪影響を与え、専門家を疲れさせ、修復作業の効率を低下させる可能性があります。このギャップは、特に人員削減の時期に顕著で、XシステムやYサービスに必要な理解とスキルを持つ専門家が、1人か2人しかいなくなった場合に生じます。

誰もがデータベースの管理方法や継続的インテグレーションのパイプラインの自動化方法を知っているわけではありません。実際、企業で最も高いスキルを持つ技術者は、通常そのような需要があるため、その作業を軽減できればビジネスのスケールに貢献します。繰り返し行われる診断や手順を常に中小企業にエスカレーションすることは、予定外の作業を生み出し、本来なら専門家が優先すべき価値の高い作業の妨げになります。このような技術的な役割を担う人材の獲得は増加の一途をたどっており、このギャップを解消することは、企業にとって長期的な取り組みがより一層重要となっています。

アクセスギャップ 最後に、アクセスギャップは、今日のベストプラクティスに従ってセキュリティー体制を維持することに関連しています。 最小特権アクセスの原則に従えば、スーパーユーザーの資格情報をITスタッフ間で広く配布したり、共有したりしてはいけません。ツール、情報、システムに適切にアクセスできなければ、解決に要する時間の長期化、修復作業の非効率化、中小企業が価値の高い作業に集中する時間の短縮など、アクセス不足に起因する悪影響が生じます。

では、PagerDutyはどのようにしてこのオートメーションギャップを埋め、ITオペレーション全体の敏捷性を向上させ、チームがより速くイノベーションを起こせるようにするのでしょうか。

アプリケーションオートメーション PagerDutyの自動化機能により、これまで専門エンジニアにしかできなかったことがエンドユーザーにもできるようになります。このプラットフォームは、自動化を他の関係者に安全に委譲し、エスカレーションの中断をなくし、待ち時間を劇的に短縮することで、これらのギャップを埋めるように設計されています。これらのプロセスは、既存のタスク自動化を運用ワークフローの個々のステップに組み込むことができ、一貫した運用体験を提供しながら、プロセスのユーザーから各ステップの特定のコンテキストを抽象化できます。

PagerDuty® Process Automationのポートフォリオは、以下の製品で構成されています。

PagerDuty® Automation Actions:PagerDutyのレスポンダーをキュレーションし、インシデントに関与するサービスの自動診断と修復につなげるPagerDutyアドオンです。 PagerDuty® Runbook Automation:エンジニアがランブックの手順を標準化・自動化し、サービスをセルフサービス型オペレーションとして委譲できるSaaSサービス。 PagerDuty® Process Automation On-Prem:エンジニアがエンドツーエンドの運用ワークフローを標準化・自動化し、関係者にセルフサービス型オペレーションとして安全に委ねることができるセルフホスティング型ソフトウェア群です。

PagerDutyの自動化機能は、エンドユーザーと認証情報やキーを明示的に共有することなく自動ワークフローを呼び出せるため、組織がアクセスギャップを安全に解消するのにも役立ちます。シングルサインオン(SSO)と統合してロールベースのアクセス制御を可能にし、プロセスレベルとステップレベルの両方で全てのアクティビティーを記録して、コンプライアンス要件を満たします。

PagerDutyの自動化機能がオートメーションギャップを埋める過程でどう役立つかについては、https://www.pagerduty.com/use-cases/automation/ をご覧ください。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

続きを読む
インテグレーション&ガイド
2022年2月24日  (更新日:2022年9月12日)    |    DevOps

アクショナブルインテリジェンスに「アクション」を入れる

AIOpsは、機械学習と人を組み合わせ、IT運用で技術的成果を実現するものです。この能力への期待が新たな競合を市場に送り込み続けています。AIOpsは、あらゆる主要なイベント管理プレーヤーにとって、メッセージングの中核となるコンポーネントとなっています。多くの企業が自社製品のブランドを変更し、AIOpsの機能を特に強調するようになりました。新興のイベント管理プレーヤーも登場し、AIOps市場に場を確保しようと試みています。ほぼ全ての観測可能なAPMベンダーが同じことを行い、自分たちが今、AIOpsツールとして選ばれていると主張しています。

AIOpsとは何か?

しかし、一歩下がってほんの少し現実を見てみましょう。AIOpsはツールではなく、一連の機能です。したがって、製品セットとしてのAIOpsを定義することは困難です。これは、自分のツールがDevOpsのツールとして選ばれていると主張するのと同じようなものです。業界をリードするアナリストでさえ、AIOpsの中核となるアプローチは何か、AIOpsの特定のヒューリスティックは何かについて、同様に意見の相違があります。このような意見の相違はあるものの、私たち実務家は、大多数のAIOpsソリューションを2つの中核的な陣営に分類して考えることができます。

オプションその1:アプリケーション監視

アプリケーション監視ツールは、最初の陣営を所有しています。この監視中心のアプローチは、メトリクス、KPI、ログなどを活用し、機械学習と傾向分析を使用して予測を行い、より早くスマートなアラートを出せるようにすることを目的としています。良い点は、全てを監視することで、根本的な原因に近づける可能性があることです。一方、デメリットは、監視を複製することになるか、これらのツールセットを活用するために現在のツールセットの大部分を削除して交換しなければならないことです。さらに、ネットワーク、ストレージ、アプリケーション、パフォーマンスモニタリングなど、全てを1つのツールで監視することは、特に「十分な」監視ツールを置き換える場合、コストがかかる可能性があります。

オプションその2:イベント管理

2つ目のアプローチは、イベント管理です。このソリューションのグループは、異なるモニタリングを統合することでドメインにとらわれない視点を維持し、単一の管理画面の結果に焦点を当てた集中型NOCの能力タイプに行き着くことになります。このアプローチでは、全ての異種情報を一元化することで、理想的にはより良い意思決定を行うことができると期待されています。しかし、ルールを更新するために一元化された場所を持つ必要があるため、能力のボトルネックになってしまう可能性があります。さらに、多くのベンダーがピーク時の使用量、1日の平均使用量、ノード数、イベントソース数などのデータに基づいて異なる料金指標を設定しているため、ソリューションのサイズ設定が難しい場合があります。

どちらのアプローチも抜け落ちているのは、「完璧な」根本原因を突き止めることができても、「さあ、どうする?」がないことです。どのように問題を解決するのか?これらのソリューションを使用するチームは、実際の銃撃戦に役立つ重要な質問をまだ残していることになります。どのサービスが影響を受けているのか?そのサービスの所有者は誰か?誰がそのサービスのために待機しているのか?どのような診断が必要なのか?どのような自動化が可能か?

これらの答えが見つからないと、サービスを復旧させるのに苦労することになります。

より良いAIOpsソリューション

PagerDutyは、ほとんどのAIOpsソリューションが無視しているリアルタイムの作業の問題を解決するために、この課題に取り組んでいます。私たちは、ノイズを減らし、根本原因を特定するためのコンテキストを作成し、労力を削減しサービスを回復するための自動化を促進します。PagerDutyを利用することで、チームはフルサービスのオーナーシップアプローチを活用し、ビルダーやイノベーターが競合他社よりも早くソリューションを市場に投入し、顧客のために価値を繰り返し提供できるよう支援します。PagerDutyは、お客様が既にお持ちのツール、チーム、機能を活用し、デジタルトランスフォーメーションに向けた幅広い戦略的優位性の構築をサポートしながら、戦術的な運用を迅速に実現するお手伝いをします。

自動化ファーストアプローチ

私たちの自動化ファーストのアプローチは、私たちのランブックオーケストレーションプラットフォームであるRundeckを第一レスポンダーとして活用することで、あなたのチームの働き方を変えることができます。Rundeckを使うことで、チームを動員することなく問題を解決できることがたくさんあります。この自動解決はMTTRを大幅に改善しますが、それと同じくらい重要なのは、各分野の専門家が本業に集中できるようにすることです。自動化が問題を即座に解決できない場合は、自動診断により、影響を受けるサービスと顧客への影響とSLAへの影響を第一レスポンダーが理解できるようにコンテキストを作成できます。そうすることで、ログ、スクリプト、手順から情報を収集し、自動化対応を推進するための指針とすることができます。これにより、全体の監査証跡が作成され、事後検証やITSM問題管理を改善し、将来、同様な問題が発生するのを避けられます。

私たちのプラットフォームは、大規模な組織や複数のチームがセルフサービスで管理できるように、API設定機能を活用しています。そのため、ルールの更新や設定の管理を中央のチームに依存するのではなく、管理者はリポジトリーやTerraformなどのツールを活用し、チームが必要とする更新を迅速に入手できるようにすることができます。中央のチームの力だけに頼って渋滞を起こすことを避けられます。

自動化を優先したデータ駆動型のセルフサービスアプローチにより、チームと機械学習が一体となって問題を解決し、根本原因を見つけるだけでなく、AIOpsの真の約束を実現できると信じています。このドメインにとらわれないアプローチでは、適切なタイミングで適切な情報を適切な担当者に提供することに集中できます。アクションを実用的なインテリジェンスに置き換えることで、ノイズやアラート疲れを減らし、第一レスポンダーが問題を解決できるようにし、労力を削減し、ビルダーやイノベーターがインシデントを追いかけるだけでなく、新機能を提供できるように変えられるのです。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年3月2日  (更新日:2022年9月12日)    |    ニュース&告知

企業全体のデジタルオペレーションを掌握する

本日、PagerDutyはCatalyticの買収により、自動化能力を新たな規模と範囲に拡大することを発表いたします。Catalyticの技術と優秀なチームによって、私たちはあらゆるワークフロー、あらゆる従業員に広く適用できる企業全体のノーコードワークフローを管理し、プロセス自動化の提供を加速させます。私たちの能力を組み合わせることで、フロントオフィスとバックオフィスの両方のワークフローに対応できる統一プラットフォームを企業に提供し、DevOps、技術、カスタマーサービスチームだけでなく、法務、財務、人事、営業、その他の職種にまで私たちの影響を拡大できます。

この新機能により、企業全体の反復作業を自動化できます。例えば、ビジネスオペレーションにおける従業員、顧客、パートナーのオンボーディング、収益チームにおける販売とパイプラインのレポート、契約、合意、雇用、購買などのあらゆるタイプの共同コンテンツレビュープロセスを含められます。実際、技術的な知識やコーディングを一切必要としない直感的なインターフェイスを使用して、既存のあらゆる反復的なワークフローを迅速に実装できます。

PagerDutyが重要な業務の管理にフォーカスする上で、自動化は常に最前線にあります。世界がより予測不可能になるにつれ、デジタルオペレーションの複雑さと企業のビジネススピードは加速し続けています。勝ち組になるには、自動化によってチームを強化し、より多くの時間をイノベーションに費やせるようにする必要があります。繰り返しのタスクで人に負担をかけることはスケーラブルではなく、最もスキルの高い、限られたリソースである従業員に余計な負担をかける結果になります。

一番大事なデジタルサービスが利用できない場合、ビジネスへの影響は驚くほど大きくなります。そのため、当初は、高いスキル(と報酬)を持つ開発者や技術チームのために、大規模なインシデント対応を自動化することに焦点を当てました。PagerDutyは、自動化されたインシデント対応とインシデント発生時の自動リアクションのパイオニアです。その後、ノイズや誤報を減らすためのイベント管理の自動化に着目し、イベントインテリジェンスでマシンタイムにロジックを注入しています。2020年10月には、Rundeckの買収を完了し、これを急速にプラットフォーム上に統合しました。これにより、ランブック、自動診断、自動修復によるタスクの自動化でレスポンダーを強化し、問題解決にかかる時間を大幅に短縮するとともに、そのための力を第一レスポンダーの手に委ね、開発者や高度なスキルを持つチームの中断やエスカレーションを完全に省くことができるようになりました。

Catalyticの機能と熟練した自動化チームが加わったことで、私たちは、ビジネスに不可欠なデジタルサービスだけでなく、企業全体のあらゆるビジネスワークフローに範囲を広げています。冗長なタスクやプロセスを排除し、可能な限り人手をかけずにビジネス全体のサービスレベルを満たし、それを超えることを保証します。

現在、PagerDutyは企業全体のあらゆる反復的なオペレーション業務に取り組んでおり、ビジネス全体のプロセスの自動化と、あらゆる状況に対応できる従業員への稼働能力の提供に注力しています。

私たちは、企業全体に機能を拡大できることに、この上ない喜びを感じています。ビジネスが顧客中心になり、デジタルサービスがビジネスのあらゆる側面を強化するにつれ、PagerDutyデジタルオペレーションプラットフォームは、全ての従業員の反復作業をサポートし、タスクや不要な中断を取り除き、最も重要なことに集中できるよう拡張していきます。私たちは、以前のRundeckと同様に、Catalyticの機能を迅速に組み込み、PagerDuty上に統一された体験を短期間で提供する予定です。

企業はPagerDutyに最も重要なサービスを任せることで、信頼を深めてきました。私たちは、その信頼に基づき、将来にわたってお客様の組織全体の業務プロセスをサポートできることを嬉しく思っています。

セーフハーバー条項

この発表には、PagerDutyの信念と仮定、およびこの発表日時点でPagerDutyが利用可能な情報に基づく「将来予想に関する記述」が含まれています。将来予想に関する記述には、「買収が完了すると予想される時期(完了する場合)」、買収によって期待される利益、CatalyticをPagerDutyの事業にうまく統合する能力、買収がPagerDutyの製品とサービスに与える影響、およびCatalyticの製品とサービスの能力に関する記述が含まれますが、これだけに限られるものではありません。既知および未知のリスク、不確実性、およびその他の要因が多数存在するため、PagerDutyの実際の結果、パフォーマンス、または業績が、将来に関する記述で表明または暗示されたものと大幅に異なる可能性があります。これには、合併した事業、技術、人員、および運営を完了し統合する際に遭遇する困難、買収に関するコスト、買収および結果として得られる製品およびサービスの市場受容、製品およびサービスのイノベーションを含む事業に対する重要な投資からPagerDutyが価値を実現できないこと、一般市場、政治、経済およびビジネスの状況、などがあります。

PagerDutyの業績に影響を与える可能性のある要因に関する追加情報は、米国証券取引委員会に提出されている2021年10月31日に終了した四半期のフォーム10-Qによる同社四半期報告書およびPagerDutyが米国証券取引委員会に提出したその他の書類に記載されています。法律で義務付けられている場合を除き、PagerDutyは、新しい情報、将来の出来事、その他の結果に関わらず、将来予想に関する記述を更新または修正する意図や義務、または実際の結果が将来予想に関する記述で予測されたものと大きく異なる理由を更新する意図を持ちません。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年2月14日  (更新日:2022年9月12日)    |    インテグレーション&ガイド

PagerDutyからSlackの新ネイティブ機能が登場 - 今すぐ利用可能

PagerDutyでは、お客様の声に耳を傾けることにかなりの時間を費やしています。対話で学んだことを生かし、私たちはSlack Integrationに新しい機能セットを追加しています。これらの機能により、SlackからのPagerDuty活用がよりシームレスになり、インシデントレスポンダーはコンテキストを切り替えることなく作業に入れるようになり、対応時間を短縮し、最終的に高い顧客満足度を維持できるようになります。

最新のSlack V2 on Webhooks V3 Integrationでは、以下の機能が利用可能になりました。

SlackのSingle Connection Managementページ。インテグレーション管理用のページを1つ持つことで、設定に必要なクリック数を減らし、手順を省き、価値創造までの時間を加速させます。 このページでは、PagerDutyのチームとSlackチャンネルを接続するだけでなく、多対多のワークスペースとPagerDutyのマッピングを行えます。

ステークホルダー専用情報共有チャンネルで、レスポンダーによるインシデント報告の投稿を容易に。ステークホルダーチャンネルはインシデントチャンネルとは異なり、レスポンダーの対応速度を落とすことなく、ステークホルダーが適切なインシデントの詳細やアップデートを閲覧できるようになっています。レスポンダーは、コンテキストを切り替えることなく、Slack から "Stakeholder Updates and Resolution Notes"(訳注:ステークホルダー向けの最新情報と解決をまとめたメモ)を作れます。

柔軟なRundeckアクションによる診断と修復。インシデントレスポンダーはスクリプト化可能な診断と修復アクションをSlackから直接デプロイできるようになりました。Rundeck Actions on Slackの詳細については、こちらのブログをご覧ください。

これらのアップデートにより、Slackから直接仕事ができるようになると思います。あなたが働いている場所で働き続けられるように、近日中に新しい機能拡張を追加しますので、ご期待ください。 Slack V2以前のバージョンからご利用のユーザーの皆様へ、これらの機能と今後リリースされる全ての機能をご利用いただくために、管理者がWebhooks V3でSlack V2への移行を実施済みであることをご確認ください。ご不明な点がございましたら、サポートまで(サポートメールで)ご連絡ください。まだ弊社のお客様でない場合は、14日間の無料トライアルにご登録ください。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年2月3日  (更新日:2022年9月12日)    |    インテグレーション&ガイド

PagerDuty RundeckのアクションをPagerDuty Slackインテグレーション内で呼び出せすことが可能に

インシデントを迅速に解決するために、協力して問題を診断する

昨年、私たちはPagerDuty Rundeck Actionsをリリースしました。これは、PagerDutyのインシデント対応ワークフローにおいて、レスポンダーを一般的な問題の自動診断と修復に直接つなげるためのPagerDutyアドオン製品です。お客様と協力し、コミュニティーの声に耳を傾けた結果、PagerDuty Rundeck ActionsがPagerDutyのSlackと統合されたことを発表します。

オートメーションとコラボレーションの融合

今回のインテグレーションにより、レスポンダーはSlackチャンネルから直接、自動診断と修復アクションを展開できるようになりました。これにより、ターミナルからサービスにアクセスしてウインドウを切り替える必要がなくなり、より迅速かつ効率的にインシデントを解決し、専門家へのエスカレーションを減せます。

1つの問題に対処するために、2台のモニターに複数のウインドウを表示させる時代は終わりました。インシデントの状況をステークホルダーに伝えるだけでなく、同じウインドウから修復アクションを展開することができます。インシデントが発生すると、レスポンダーはSlackインスタンス内にインシデント専用のチャンネルをすばやく作成し、影響を受けるチームやステークホルダーとコラボレーションし、診断手順を実行し、オートメーションを呼び出してリアルタイムに問題を修復できます。

CollabOpsの実践

第一線のレスポンダーや担当者は、IT部門全体で構築したつながり(具体的にはPagerDuty・Rundeckと統合したアプリケーションやサービス)を活用し、チャットボットを導入してアクションを実行させることができます。問題をエスカレーションして上に受け渡すのではなく、このインテグレーションにより、仕事に適した人材がいる専用チャンネルにインシデントをすぐに投下し、修正に向けて共同作業を行えます。また、この統合は、インシデントが発生すると、そのロジスティクスを積極的にキャプチャーして記録し、文書化プロセスを完全に透明化して、全てのステークホルダーがアクセスできるようにします。

Rundeckアクションの仕組み

PagerDuty Rundeck Actions を使うと、エンジニアは手間がかかり繰り返し行われる診断手順の自動アクションを作成してレスポンダーに委任できるようになり、繰り返し行われるタスクに費やされる時間を削減できます。また、フェイルオーバーなどの一般的な低減アプローチやその他の修復手法の自動化も含まれます。 既知の問題に対するシンプルで繰り返し適用できる修復法も、イベントトリガーを使って人間の介入なしに発動できるので、緊急の問題だったものを解決済みの後処理に変えることができます。PagerDutyで作業するレスポンダーがインシデントの解決を加速できるように、Rundeck ActionsはAutomated Diagnosticsと修復をインシデント対応ワークフローにつなげます。 Automated Diagnosticsは、インシデント発生時にレスポンダーが呼び出せる、本番サービス用の自動化されたアクションのセットです。一般的なテストを手動で実行する専門家にエスカレーションするのではなく、第一レスポンダーはPagerDutyから安全にこの自動化を呼び出すことができ、インシデントタイムラインにリアルタイムで返されるレスポンスを確認できます。

PagerDuty Rundeck Actionsを使用すると、チームは以下のことが可能になります。 レスポンスタイムを最大30分短縮 Slack経由でレスポンスチーム全体に専門知識を共有 レスポンダーが呼び出される前に、人的支援と自己修復の自動化を開始 ファイアウォールやVPCの内側で安全な自動化を実行 手作業に代わる自動化されたアクションを導入 円滑なポストモーテムとオペレーター作業軽減のためのインシデントの文書化を充実

Rundeck Actionsがどのように機能するかについてもっと知るには、ナレッジベースをチェックしてください。さらに、アカウントマネージャに連絡するか、デモをリクエストしてください。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年1月28日  (更新日:2022年9月12日)    |    インシデント&アラート

インテリジェントなサービス設計

共著者:PagerDutyデータサイエンティストVI、Chris Bonnell氏

EIアーキテクチャーシリーズの第4回目、「Intelligent Alert Grouping(インテリジェントアラートグルーピング)」についてご紹介します。前回は、インシデントのマージを使用してIntelligent Alert Grouping をトレーニングする方法(こちら)と、デフォルト マッチングを改善するためにアラートのタイトルを設定する方法について説明しました。今回は、サービスデザインがIntelligent Alert GroupingやPagerDutyアプリの使用感にどのような影響を与えるかについて説明します。

サービスについて

サービスを設計したり、再設計したりする前に、組織で機能するサービスの定義を持つことが重要です。この定義は、理解できるほどは具体的である必要がありますが、複数のチームがサービスとは何かを抽象的には同じように理解できるように広いものである必要があります。PagerDutyでは、次のような定義を使っています。 サービスとは、チームによって完全に所有される、価値を提供する機能の個別部分である。

担当チームは、サービスを構築し維持するチームであり、あらゆるインシデントに対応することも含まれるため、把握しておくことが重要です。サービスとオーナーシップについての概説は、サービスの定義に関する完全なサービスオーナーシップ運用ガイドを参照してください。

サービスやその所有者について考えるだけでなく、サービス名にも気を配る必要があります。Service Directoryに目を通すと、追加の制度的知識がなくても、それぞれのサービスが何であるか簡単に理解できるようになるはずです。簡単に言うと、「Payment Service」という名前のサービスがあったり、あらゆるトランザクションサービスがギリシャ神話の神々にちなんで名付けられているという社内文書を知っているか参照して、どのギリシャ神が支払いを処理するサービスに相当するかを調べるかの違いです。この点については、Full Service Ownership Ops Guideの「Naming Services」のセクションで詳しく説明しています。

PagerDutyアプリでは、サービスはビジネスサービスとは区別されます。ここまでは、全てサービスに関連する話です。また、ビジネスサービスとの混同を防ぐため、弊社のドキュメントでは技術サービスと表記している場合があります。ビジネスサービスは、技術サービスや他のビジネスサービスの集合体であり、通常、ビジネスロジックおよび/またはステークホルダーに従います。Intelligent Alert Groupingは技術サービスのみを利用し、ビジネスサービスは利用しないため、この記事でサービスと書いた場合、技術サービスのみを指します。

粒度

サービスをどう分けるか、そのバランスを考えてもすぐには分かりませんし、万能の解決策もありません。基本的には、粒度の高いものと低いもののバランスを取り、時には置き換えすることになります。例えば、PagerDutyのアプリケーションでは、1つの監視ツールで、その構成機能を全部別のサービスに分解しています。一方、より広範で粒度の低いサービスの使い方としては、iOSとAndroidの開発を別々のチームが担当している場合でも、あらゆるモバイルアプリケーションを1つのサービスとして提供することが挙げられます。後者の例では、サービスの構成方法について単一の推奨事項が存在しない理由は、組織にモバイルチームが1つしかないとか、モバイルチームがないとか、異なる基準で分割されたモバイルチームがあるためだとよく分かります。

では、どうすればよいのでしょうか。私たちは、サービス定義のナビゲートに役立ついくつかのアドバイスを抽き出せます。まず始めに、オーナーシップについて説明します。PagerDutyアプリケーションでサービスを定義する主な理由の1つは、インシデント対応のためです。つまり、サービスの問題に対処できるのは誰かを知ることは、サービスを所有しているのは誰かを知ることなので、組織内で誰がサービスを所有しているかによって、PagerDutyでサービスをどのように定義するかを決めることができます。これは、完全なサービスオーナーシップモデルではないものの、望ましいエスカレーションパスが分かっているサービス構造が既にある場合、その知識を活用できる点で重要です。この場合、Intelligent Alert Groupingがインシデントをグループ化すると、サービスが希望するエスカレーションパスに関連付けられるだけにしても、このコンテキストではそれが重要であり、達成する最終結果になるのです。

また、現在のプロジェクトを見直して、どれが事実上機能単位になっているかを確認し、それらをPagerDutyで1サービスとして定義する必要があります。こうすることで、エスカレーションパスが同じプロジェクトは正しくグループ化される一方で、エスカレーションパスの関係で複数のプロジェクトが単一のサービスとして定義され、可視性が損なわれるというシナリオを防ぐことができるはずです。もう少し踏み込んで、常にインシデントが同時に発生している2つ以上のサービスがある場合、それらを1つのサービスに集約する必要があるかもしれません。具体的な例として、メトリクス、ハートビート、ログなどの個別のコンポーネントを持つモニタリングマイクロサービスがあるとします。これらがそれぞれPagerDutyサービスを持っている場合、ほとんどの場合、インシデントがこれら全サービスに同時にまたがることになるので、モニタリングマイクロサービス自体として1つのサービスにまとめる必要があります。一方、同じ人が働いているからと言って、別々のプロジェクトが1つのサービスとして定義されている場合、そのサービスは十分に粒度が揃っていない可能性があります。このシナリオでは、PagerDutyアプリに関する限り、サービス内のエンティティーは全て1つの「もの」であるため、どのエンティティーが他のエンティティーよりも注意を払う必要があるかを判断するのが難しくなります。

次に何をするべきか

既存のサービス、あるいはこれから作成されるであろうサービスを見て、それらをチェックすることから始めましょう。

エスカレーションパス 名称 機能単位

そして、PagerDutyアプリケーションでサービスを定義する際の指針として使用します。Intelligent Alert Groupingは、関連するサービスの下にアラートをグループ化することで、そこからの作業を行います。サービスをゼロから設計したり、サービスの定義を見直したりする場合は、「フルサービス オーナーシップ運用ガイド」で、レスポンスの命名とオーナーシップに関するベストプラクティスを参照し、「(技術)サービス」と「ビジネスサービス」に関するドキュメントもご覧ください。次回は、このシリーズの最終回で、これまで取り上げた内容を全て再録する予定です。ei-architecture-seriesタグを使うと、このシリーズの記事をご覧いただけます。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年1月26日  (更新日:2022年9月12日)    |    ベストプラクティス

Event Orchestrationの活用でノイズを減らし、次善の策を講じる

お客様からは、管理しきれないほどの大量のノイズや複雑性に対処しているため、根本的な原因を突き止め、迅速に解決することが難しいという声をよく聞きます。ノイズの選別、イベントの処理、コンテキストの収集に費やす労力は、多くの時間を浪費することになります。

そこで私たちは、Event Orchestrationを発表し、Event IntelligenceとDigital Operationsをご利用中のお客様に月曜日から提供し始めました。

PagerDutyのEvent Orchestration担当シニアプロダクトマネージャーであるFrank Emeryに、この機能を構築した理由と、お客様の行動やフィードバックがどう開発の方向性を決定したのか、その背景を詳しく聞いてみました。

Q: 新機能のEvent Orchestrationについて教えてください。

A: PagerDutyのプラットフォーム全体で見ると、20%のインシデントが5分以内に解決されています。解決が難しい大きなインシデントを5分以内で解決できることはありません。このことから分かるのは、インシデント対応には、診断テストの実行やサーバーの再起動など、必要ではあるが手作業に近いプロセスが存在し、それがチームの時間を奪い、生産性や集中力を低下させていることです。このようなケースでは、的確な自動化によってインシデントレスポンス時の手順を短縮することが可能です。場合によっては、インシデントを担当から外すこともできるかもしれません。これらのユースケースを、解決時間が15分や30分のインシデントの原因となる反復タスクに拡大すると、時間の節約、生産性、集中力の向上の可能性はさらに高まります。

それは、「インシデント発生時にお客様のチームが常に行っている手作業や繰り返しの作業に費やす時間を減らすために、当社のプラットフォームを利用できるようにするにはどうすればよいか」ということです。オートメーション化することで、すぐ処理できるイベントがレスポンダーの手を煩わす数を減らし、実際に彼らの専門知識が必要なインシデントに時間を割くことができるようにするには、どうすればよいでしょうか。

Event Orchestrationについて考えるとき、もしお客様がルールを設定する方法をより柔軟にし、より多くの自動化機能を前もって使用できるようにすれば、チームが通知を受ける前に、これらのすぐ解決策が分かるタスクをできるだけ多くカバーすることができるのではないでしょうか。

Q: Event Orchestrationは、Event Rulesとはどう違うのですか?

A: 私たちがうまくやったのは、Event Rulesを利用して、イベントの取り込みパイプラインに直接設置する意思決定エンジンを構築したことです。Event Orchestrationでは、複雑なロジックを備えた新しい条件言語を使い、条件に基づいて次善のアクションを広範に起動できます。ある例では抑制、ある例ではルーティング、あるチームではリアルタイムに取り込まれる自動診断や自動修復などの自動アクションを起動したいと思うかもしれません。

オーケストレーションで特定の状況を処理するように設定すると、マシンはロジックを使って状況を識別し、その状況に基づいて対処方法を決定します。これにより、誰かが通知を受ける前に、意思決定エンジンがこれらのタスクのいくつかを処理する道が開かれ、そもそも人間が必要な場合には、インシデント対応プロセスに増員し始めることができます。

Q: Event Orchestrationの利用を検討している人にとって、ハードルの低い利用例を教えてもらえませんか?

A: お客様のことを考えると、まず2つの使い方のどちらかをされることが多いでしょう。

1つ目は、ノイズリダクションです。ノイズは非常に一般的な問題で、スタックを監視するために接続されるあらゆるツールと、それらがどうアラートを送信するかを考えれば驚くことではありません。私たちは、重複排除や抑制といった他の機能や、インテリジェントアラートグルーピングといったMLオプションも用意していますが、お客様の中には、より正確な情報を得たいと考えている方もいらっしゃいます。ノイズリダクションにEvent Orchestrationを使うと、ユーザーは正確なルール条件を利用して、非常に多くのターゲット状況を設定し、チームのためにノイズをそらし、統合、抑制して、重要な信号のみを通過させることができます。

2つ目は自動化です。自動化がどこまで高度になるかは、運用の成熟度によって異なります。インシデントレスポンスの初期段階を自動化できる可能性は非常に高く、その多くのステップは実際に非常に繰り返されることが多いものです。

最もノイズの多いサービスについて考えてみてください。そのサービスのインシデントのうち、同じ初期診断手順を必要とするものがどれだけあるか考えてみてください。エンジニアからよく聞く話ですが、障害が発生すると必ず電話がかかってきて、問題解決のために誰かが何かを始める前に、毎回このような手順を踏まなければならないそうです。通常、これらのステップはスクリプトを実行したり、正しいコンテキストを見つけるために情報を収集したりするものです。多くのシナリオで必要とされる、よく知られた反復タスクである診断の自動化から始めることが、手軽ですぐに成果を上げやすいシナリオだと言えます。

もっと詳しく知りたいですか?Event Orchestrationの詳細については、ナレッジベースの記事、またはこちらのデモをご覧ください。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年4月25日  (更新日:2022年9月9日)    |    ベストプラクティス

最適なインシデント対応ソフトウェアの選び方

デジタルエコシステムの複雑化に伴い、インシデントがかつてないほどのスピードで発生しています。さらなる負担に対処するため、インシデントレスポンダーは、労力とノイズを減らし、適切な人材を適切なタイミングで現場に投入する、拡張性と再現性のあるインシデント対応プロセスの確立を支援するソフトウェアに注目しています。

最高のインシデント対応ソフトウェアは、インシデントのライフサイクル全体に対応します。アラートノイズの低減から詳細なインシデント分析の提供まで、インシデント対応ソフトウェアは、インシデント解決のための自動的および人的要素の両方をカバーし、収益の損失、顧客体験の低下、チームの燃え尽きなどを防止する必要があります。

インシデント対応ソフトウェアとは?

レスポンダーは、インシデントを迅速に解決する必要があることを理解していますが、リソースと時間の不足により対応に手間取っています。インシデントの特定、解決、予防に対する最新のアプローチがなければ、何が本当に修復を必要としており、何が後回しでよいのかがわかりません。このため、非効率的で部分的にしか効果のない消火活動のサイクルから抜け出せず、長期的なイノベーションと計画的な業務への投資が妨げられています。

インシデント対応ソフトウェアは、インシデントが発生するたびに、チームがリアルタイムで適切なアクションを取ることを支援し、重要なインシデントの迅速な解決と今後の発生を防ぐための知識の習得につなげます。さらに、ステークホルダーや経営陣に情報を提供し、顧客への影響を軽減することができます。チームは、合理化されたエンドツーエンドの対応によって、より大量のインシデントを管理し、レトロスペクティブ(振り返り)によって対応プロセスを継続的に改善することができます。

インシデント対応ソフトウェアの特徴

レスポンダーの動員

インシデント対応ソフトウェアは、業務上の問題やインシデントが、常にリアルタイムで対応できる適切な個人またはチームに送られるようにする必要があります。理想的には、レスポンダーはどこにいても、どのデバイスからでも、問題に対する通知を受け取り、直ちに行動を起こすことができる必要があります。

レスポンスの自動化

チームは、どのような優先度のインシデントに対しても、適切な対応を設計する能力と自律性を備えていなければなりません。自動化能力は、診断から自動修復に至るまで幅広く対応する必要があります。つまり、レスポンダーはインシデントに関する正しい情報を即座に得ることができ、自動化によって人の介入なしにインシデントを解決できる可能性さえあるのです。

ステークホルダーとのコミュニケーション

今日のインシデント対応においては顧客への影響を軽減するために技術チーム以外の協力も必要です。経営陣、サポート、さらにはマーケティング、法務、営業などのステークホルダーは、レスポンダーの作業を中断することなく状況を把握する必要があります。インシデント対応ソフトウェアは、レスポンダーが対応プロセスをできるだけ中断させることなく状況の更新を伝えられるようにする必要があります。

統合化する能力

チームは、インシデント情報の収集、進捗状況の記録、および全体のコミュニケーションを行うために、さまざまなツールを使用しています。インシデント対応ソフトウェアは、モニタリングツール、ITSMツール、チャットやビデオ会議などのコラボレーション・コミュニケーションツールなど、チームが既に使用しているツールと統合されていることが理想的です。

オペレーショナルインサイト

インシデント対応ソフトウェアは、時間の経過とともにチームが向上するよう支援する必要があります。アナリティクスは、過去のシステムパフォーマンスの全体像を把握することで、よりスマートでリアルタイムの意思決定を可能にします。

インシデント学習

振り返りは、合理的な学習プロセスを提供し、インシデントの解決と予防をより効果的に行えるようにします。インシデント対応ソフトウェアでは、タイムラインを作成し、インシデントの重要な進展を文書化し、今後の改善計画を立てることができるようにする必要があります。

インシデント対応ソフトウェアのメリット

レスポンダーの健康と体験の向上

インシデント対応ソフトウェアを導入することには、多くのメリットがあります。重要な利点の1つは、レスポンダーの健康と体験です。オンコールで対応することは大変なことであり、疲弊し、燃え尽き症候群や離職につながる可能性があります。ノイズや労力を制限するインシデント対応ソフトウェアがあれば、最前線にいるチームは、消火活動の時間を減らし、イノベーションに多くの時間を費やすことができます。

社内コミュニケーションの向上

インシデント発生時のコミュニケーションは重要であり、技術チーム内や技術チーム間だけではありません。ビジネスチームもインシデントにどう対応すべきかを知っておく必要があります。営業はデモを延期すべきか。マーケティングはキャンペーンを一時停止すべきか。サポートはチケットの増加に備えるべきか。インシデント対応ソフトウェアによって、チームはこれらの社内ステークホルダーとコミュニケーションを取り、全員が同じ見解を持つことができます。

お客様との信頼関係の向上

顧客の期待はかつてないほど高まっており、インシデントは信頼を損なって解約につながる可能性さえあります。インシデント対応ソフトウェアを使用すれば、対応プロセスが合理化され、MTTRが向上し、顧客のためにサービスをより早く復旧させることができます。さらに、インシデントの状況について顧客と積極的にコミュニケーションをとり、信頼と透明性を高めることができます。これによって、競合他社に差をつけることができます。

結論

インシデントの量と複雑さが増すにつれて、組織は収益の損失と顧客体験の低下のリスクにさらされています。インシデント対応ソフトウェアは、チームが重要な業務に迅速かつ適切に対応し、関係者全員の体験を向上させるために役立ちます。インシデントは避けられないものですが、最高のインシデント対応ソフトウェアは、対応者がサービスを迅速に正常な状態に戻し、組織全体に拡大する改善を行うために必要なツールを提供します。

この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年4月19日  (更新日:2022年9月9日)    |    ニュース&告知

PagerDutyの2021年ソーシャルインパクトレポート。インパクトマインド醸成がもたらすパワーの全貌を明らかに

この度、PagerDutyの2021年ソーシャルインパクトレポートを発表することができ、大変嬉しく思います。

私たちが関心を寄せているのは、PagerDutyが存在することで世界はより良くなっているか、という問いです。私たちは、私たちの行動が、個人として、また共同で、周囲の世界にどのような影響を与えるかを検討し、説明するよう求めるソーシャルインパクトの考え方を採用することで、この方向に進んでいます。

PagerDutyの2021年ソーシャルインパクトレポートは、私たちのソーシャルインパクト部門であるPagerDuty.orgを通じて、またお客様、コミュニティーパートナー、デュートニアン(訳注:PagerDutyの従業員)との連携によって、私たちが2021年にもたらした影響力を説明します。今年の報告書には、私たちのソーシャルパフォーマンスに関するより詳細な説明とともに、初となる環境・社会・ガバナンス(ESG)の開示が含まれています。この報告書は、私たちがステークホルダーやコミュニティーに対して説明責任を果たし続け、世界に与える影響をどのように測定し、適応させているかについて透明性を確保するために不可欠なものです。

PagerDutyソーシャルインパクトレポート2021の全文はこちらで公開されています。

昨年の私たちの仕事は、パンデミック、政治的分裂の深化、人種的正義の強化の必要性が叫ばれる中で完了しました。今年も、その背景には波乱の予感があります。気候変動や世界的な紛争、不公平の拡大など、私たちは多くの未知なるものに直面しています。しかし、私たちが力を合わせれば、より大きな正義と自由と健康を全ての人にもたらすことができることを、私は知っています。

変化を加速させるソーシャルインパクトの取り組み方

私たちが支援したプロジェクト、非営利団体や公益法人のミッション達成を支援したこと、そしてデュートニアンが地域社会に惜しみなく還元したことを誇りに思います。これらの成果は、私たちの仕事とパートナーシップの指針となる3つの明確な原則によって導かれています。私たちは、どのようにインパクトを与えるかがインパクトそのものと同じくらい重要であることを、身をもって体験しているからです。ここでは、そのハイライトをご紹介します。

私たちは、全面的なサポートを提供します。製品、人材、意思表明、慈善活動資金など、会社の資産を総動員し、パートナーの目標に最も適した方法で支援を行います。 187万ドルの資金を全世界の668団体に提供。 2021年の助成対象団体の75%が、女性や有色人種のリーダーによって率いられている。 2万3300人にCOVID-19ワクチン接種(Go Give Oneキャンペーンへの投資の結果)。

私たちは、信頼に基づく公平な助成金支給を実践しています。 基本的な運営方針は、信頼に基づく参加型のフィランソロピーです。 健康格差の是正とCOVID-19ワクチンへの公平なアクセスを支援するための投資を行い、環境正義に関する助成金を試験的に導入し、従業員リソースグループ(ERG)助成金創出プログラムを開始。 助成金は用途を限定しない資金として提供され、組織が革新的で長期的なプログラム投資を行えるよう、初めて複数年にわたる助成を実施。 社会問題、風土、文化に関する見識を持ち、最も必要とされる場所に、最も必要とされるタイミングで資金を投入するリーダーに託す。

私たちは、インパクトマインドを育んでいます。 私たちの行動が、個人として、また集団として、周囲の世界にどのような影響を及ぼすかを検証します。私たちは、デュートニアン一人一人が、それぞれの役割の一部として、このインパクトを生み出すことができるよう、力を与えます。

92%のデュートニアンがボランティア活動や寄付に参加。
デュートニアンによるボランティア活動は5232時間で、2020年と比較して83%の増加。
90%のデュートニアンが、ソーシャルインパクト活動を実施しているこの会社で働くことを誇りに思うと回答。

レポート本文では、私たちの非営利団体のお客様がどのようにPagerDutyのプラットフォームを活用して活動を進めているのか、詳しくご紹介しています。この中には、米国で処方された未使用の薬の流通を促進するためにPagerDutyを利用しているSIRUM社が含まれています。また、WeRobotics社はPagerDutyを利用して、フィリピンのタウィタウィ州でのCOVID-19ワクチン配送のためのドローン利用の現場・業務支援のためのインシデント対応を支援しています。

ESGロードマップによる企業指針、社会・環境貢献への取り組み

ESGを正式なものとし、日常業務に組み込むことは、企業としての回復力にとって重要であり、公平で持続可能な世界に貢献するという当社のビジョンに沿ったものです。私たちのESGプログラムは、私たちのソーシャルインパクト活動を自然に進化させたものです。PagerDutyの既存のプログラムは、国連の17の持続可能な開発目標(SDGs)のうち11の目標に対する進捗に寄与しています。私たちは、これらの成果を促進し、PagerDuty内のESGをさらに整合させるための投資を行っています。2021年、私たちは重要な優先事項を特定し、ESGロードマップを作成し、説明責任を割り当て、初期投資の目標を定めました。さらに、進捗を測定するために、以下のようなベンチマークを設定しました。

男女間の賃金格差を0.01ドル以内にすることを達成 人種・民族間の公平な給与を0.02ドル以内にすることを達成 多様性のある取締役会を構築した結果、50%が女性、75%がマイノリティーに ESGの優先順位を決定するための最初のマテリアリティ評価を実施 2年間の温室効果ガスインベントリーを完了

この報告書では、包括的雇用プログラム、包括性、多様性、公平性(ID&E)目標、環境への影響の評価と削減方法など、当社のESGプログラムについてより詳細に説明しています。

2022年に向けての展望

私たちは、非営利団体のお客様により大きな価値を提供するために新しいプログラムを立ち上げ、Time-Critical Health(一刻を争うヘルスケア)と人種的平等への初期の投資と学びを基にしましたが、より健康でより公平なコミュニティーを作るためには、さらにやるべきことがあることもわかっています。

2022年、私たちは引き続きソーシャルインパクトをPagerDutyのビジネスの中核に据え、PagerDutyのテクノロジーがいかにしてお客様の医療の遅れを治し、環境への影響を軽減するか、また私たちの社会正義への投資がいかにして最も効果的に制度的差別をなくすことができるか、などを考えていきます。現在のモデルを逆転させた新しいプログラムであるImpact Labsを立ち上げ、Time-Critical Healthパートナーに100万ドル以上の資金、製品クレジット、技術ボランティアサポートを提供します。また、新しいImpact Pricingを導入し、コストの障壁を減らし、非営利団体や認定公益法人がPagerDutyプラットフォームの利用を拡大できるようにする予定です。そして、気候変動に対する公正かつ公平なコミュニティー戦略を構築し、長期的な投資の指針としています。私たちは、ESGの優先事項を進め、その進捗を報告し続けていきます。

この数年間は、未知なるものへの挑戦と、日々の回復力の鼓動の連続でした。私たちは、パートナー、お客様、そして私たちが働くコミュニティーからインスピレーションを受けながら、楽観主義者であり続けます。私たちは、全ての人が自由に活躍できる応答性の高い世界というビジョンに向かい、より多くの正義、自由、そして健康を目指し、努力を続けていきます。

PagerDutyソーシャルインパクトレポート2021の全文はこちらからご覧いただけます。https://impact-report.pagerduty.com/

PagerDuty.orgと、非営利団体やソーシャル企業のためのImpact Pricingの詳細については、https://www.pagerduty.com/foundation/

この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年4月7日  (更新日:2022年9月9日)    |    インシデント&アラート

Intelligent Alert Groupingシリーズまとめ

Co-authored by Chris Bonnell, PagerDuty Data Scientist VI

Intelligent Alert GroupingについてのEIアーキテクチャーシリーズの最終回へようこそ。このシリーズを楽しんでいただけたなら幸いです。もし私たちの過去の投稿を見たいなら、ei-architecture-seriesタグをお使いください。少し時間をとって、私たちが学んだことを全て振り返ってみましょう。

記事のポイント

Intelligent Alert Grouping(IAG)のデフォルトの動作は、インシデント管理における抽象化されたパターンに基づいており、また機械学習モデルも利用しています。つまり、このツールは、いわば経験則に基づいた推測を数多く行うことができますが、個々の環境では完全に一致するものを生成できない可能性があります。それを補うために、マージ、タイトル、サービスデザインなどを活用することで、グループ化の動作を改善することができます。

マージ動作

インシデントは、PagerDutyアプリケーションのマージと呼ばれるプロセスによってグループ化されます。一般に、どのインシデントも他のインシデントとマージすることができます。特にIAGでは、この投稿でレビューしたように、個々のアラートを新しいインシデントにマージすべきか分離すべきかを判断しようとするときに、Alert Titleフィールドを分析します。アラートが不適切に共通のインシデントにマージされた場合、それらを分離し、あるべき場所に移動させるための措置を講じることができます。機械学習モデルは、反復するたびに行動を強化するため、アラートが残るか、マージされるか、移動されるかによって、今後の行動が改善されます。

アラートタイトル

IAGはAlert Titleフィールドを基にマージ動作を行うため、以前の投稿で一般的な機械学習の原理を用いたアラートタイトルの基本を説明しました。ここでは、3つの重要なポイントがあります。

アラートのタイトルは、人間と機械学習の両方に役立つべきもので、機械学習寄りにするため、残りのインシデントの詳細は詳細に記述すべきです。 機械はコンテキストを理解できないので、コンピューターが「一意」「共通」を区別できるようにするのが重要であることを忘れないでください。 プッシュ通知で表示されるアラートタイトルの部分には字数制限があるため、人間向けのテキストはタイトルの後半ではなく、前半に配置するようにしましょう。

これらの実装方法を掘り下げるには、前述の記事の機械学習の部分と、Towards Data Scienceブログの「Introduction to Natural Language Processing for Text」のブログ記事をご覧ください。

サービスデザイン

最後に紹介した概念は、サービスデザインのことです。 一般的な考え方としては、同じサービス上の類似したアラートはデフォルトで、他のサービス上のアラートよりも相関性が高いと想定されます。サービス定義をどの程度細かくするかによって、PagerDutyアプリケーションで「サービス」をどのように実装するかが決まるため、ここではかなり多くのことを説明できました。一般的なルールとして、2つの「もの」が別々のサービスであるべきかどうか分からない場合は、望ましいエスカレーションの経路を模倣してください。もし両者が同じチームや人によって所有されているのであれば、PagerDutyアプリケーションで両者を1つのサービスとみなすことで、エスカレーションを尊重し続け、アラートの相関性をより高くするという利点も得られます。もし、異なるチームが担当している場合や、アラートの相関性を高めたくないという理由で論理的に区別している場合は、別々のサービスとして定義してください。所有するチームについては、一般的なサービス定義と所有権のベストプラクティスについて詳しく知りたい場合は、フルサービス所有権運用ガイドをご覧ください。

今後の方向性

ここまでです。Intelligent Alert Groupingをフル活用する方法について、時間を割いて学んでいただき、本当にありがとうございました。もしこれらの記事を長期的に参照したい場合は、ei-architecture-seriesタグをブックマークしてください。さらに議論を深めたい場合は、当社のコミュニティーフォーラムをご覧ください。より詳細なQ&Aについては、サポートチームにお問い合わせください。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年4月4日  (更新日:2022年9月9日)    |    インテグレーション&ガイド

PagerDuty® Automation Actionsでチームの自動化能力を民主化する

現実を直視しましょう。インシデントは高くつくものです、本当に。しかし、本番環境におけるインシデントの高いコストは、必ずしもサービスの低下やネガティブな顧客体験が原因とは限りません。PagerDutyのレスポンスデータによると、インシデント収束までの時間の50%以上は、最初のレスポンダーによる調査と出動段階(私たちは「トリアージ」と呼んでいます)に費やされています。 言い換えると、問題を見極め、解決するのに適役を呼び出す部分です。

上記の統計を考慮すると、インシデントライフサイクルの影の経費は、インシデントを発見したエンジニア、問題に対応し根本原因を特定したオンコールエンジニア、その他インシデントライフサイクルに動員されるあらゆる分野の専門家の時間であることは明らかです。さらに、対応プロセス全体に手作業が加わると、コストがかさみます。非常に高くつきます。

実際のところ、開発組織の時間は、ビジネスの利益と同じくらい貴重で重要です。そして、サービスやアプリケーションの開発が複雑化するにつれて、「削減された時間」は、追跡、定量化、および継続的な改善を行うための、より重要な指標となります。インシデント対応プロセスのさまざまな側面を自動化する方法を見つけることは、チームの時間を節約し、全体的な効率を高めるのに役立ちます。どうすればいいのでしょうか?PagerDuty® Automation Actions(旧PagerDuty Rundeck Actions)の出番です。

PagerDuty® Automation Actions

PagerDuty® Automation Actionsアドオンは、第一線のレスポンダーをPagerDuty内の修正オートメーションに直接接続します。インシデントが発生したときに専門家にエスカレーションする代わりに、レスポンダーは安全に委譲された自動化機能を使用してインシデントのトリアージと解決を自分で行うことができます。その結果、チームはMTTRを短縮し、専門家の業務中断を減らし、インシデントを迅速に診断して修復することができます。

PagerDuty® Automation Actionsは、自動化された診断と修復をインシデント対応ワークフローに接続します。Automated Diagnosticsとは、インシデント発生時にレスポンダーが自動的に呼び出すことができる、本番サービス用のアクションのセットです。専門家にエスカレーションして一般的なテストを手動で実行させるのではなく、レスポンダーはPagerDutyから安全かつ確実にこの自動診断を実行し、インシデントタイムラインにリアルタイムで返されるレスポンスを確認することができます。

サービスの再起動や診断など、指定されたアクションを実行することができます。

これらの診断テストにより、レスポンダーは、大人数を巻き込んだり、一般的なレスポンダーの階層をエスカレーションすることなく、より効率的に適切な専門家にインシデントをエスカレーションして解決できます。専門家は、これらの一般的な診断の結果を見て、すぐに取りかかることができます。

さらに、チームはSlackインスタンスから直接これらのアクションを呼び出してインシデントについて共同作業を行うこともできます。これにより、ターミナルからサービスにアクセスしたり、ウインドウを切り替える必要がなくなり、より迅速かつ効率的にインシデントを解決できるようになり、専門家へのエスカレーションも減らすことができます。自動診断の利用が進むと、Event Intelligenceを利用した自動修復やトリガーなどの用途にも利用できるようになります。

PagerDuty® Automation Actionsは、組織の応答プロセスにおける4つの主要な問題領域を解決するのに役立ちます。

サイロ化された専門知識。** 第一線のレスポンダーは、組織の環境内にある全てのアプリケーションやサービスの遺伝子構成を把握しているわけではありません。 専門家への絶え間ない割り込み。** レスポンダーは、そのアプリケーションやサービスの専門家と思われるエンジニアにエスカレーションを行い、イノベーションを妨げ、インシデント収束を鈍化させています。 繰り返し、手動の診断手順。** インシデント発生時の最初のステップは、大体同じです。インシデントの解決に取り組む以前に、これらの同じ手動ステップを踏んでおく必要があります。 複雑で広大な本番環境。** どのシステムにアクセスし、どのようなアクションを取るべきかを知るには、時間を要することがあります。さらに、全ての対応者が特定の本番システムにアクセスする権限を持っているとは限らず、エスカレーションプロセスを難しく長引かせることがよくあります。

PagerDuty® Automation Actionsは、上記の課題を次のように解決します。

チーム間でオートメーションを委譲する。** 通常専門家が呼び出す自動化された手順を、第一線のレスポンダーに展開する。 より少ないエスカレーションで、より早くインシデントを解決する。** 一般的なリクエストや作業を自動化することで、エスカレーション先を特定する時間を減らし、より多くの時間を修正に費やすことができます。 人手を介した支援・自己回復の自動化を誘発する。** PagerDutyのEvent Orchestrationにより、レスポンダーが呼び出される前に診断アクションを呼び出すことができます。 セキュリティーを考慮した自動化の安全な発動。** レスポンダーは、インシデントの影響を受けるシステムに対して実行する権限を持つアクションのみを表示します。全てのアクションはログに記録されるため、強固なセキュリティー体制を維持することができます。

以上のことを簡単に箇条書きでまとめると、PagerDuty® Automation Actionsはチームを支援します。

応答時間を最大30分短縮、MTTRを最大25%短縮 エスカレーションされるインシデントの量を削減 対応チームに専門知識を共有 レスポンダーが呼び出される前に、人手を介した支援と自己回復の自動化を開始 ファイアウォールやVPCの背後にある安全な自動化を誘発 手作業に代わる自動化されたアクションを導入 事後検証の円滑化、オペレーターの作業軽減のためのインシデント文書化の充実

PagerDutyの自動化ポートフォリオについてもっと知りたい方は、自動化ハブをご覧ください。PagerDuty Automation Actionsについて、また、それがどのようにチームの時間とコストの節約につながるかを知りたい場合は、アカウントマネージャーに連絡するか、今すぐ詳細をご覧ください。

この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年3月30日  (更新日:2022年9月9日)    |    DevOps

最新情報:オンコール管理、インシデント対応、Event Intelligence、プロセス自動化など

PagerDutyのデジタルオペレーションプラットフォームの新しいアップデートと機能拡張を発表できてうれしいです。製品チームからの最近の更新は、オンコール管理、インシデント対応、プロセス自動化、PagerDutyコミュニティー&アドボカシーイベントが含まれます。新しい機能により、ユーザーや顧客はインシデントの迅速な解決や以下のようなことを行うことができます。

既存のオンコール管理スケジューリング機能のビジュアルを改善しました。 アーリーアクセスプログラムに参加して、最新の自動インシデント対応機能をお試しください。 PagerDuty® Process Automationのリブランディング、PagerDuty® Runbook AutomationのGAリリース、PagerDuty® Process Automation On-Prem 4.0のリリースについて詳しく説明します。 CollabOps統合内で直接PagerDuty® Automationアクションを実行できるようになります。 Event Intelligenceと機械学習で不要なノイズを削減します。 最新のパートナーエコシステムの発表についてお読みください。 コミュニティーチームと製品チームのメンバーが新製品やソフトウェア業界のリーディングプラクティスを紹介しています。今後のイベントへの登録や、最近のポッドキャストやTwitchストリームをどうぞ。

オンコール管理 スケジュール一覧のUI刷新

スケジュール一覧ページのUIが新しくなります。この新しいビジュアルにより、必要な情報を簡単かつ迅速に見つけることができ、より柔軟な対応が可能になります。その他の変更点は以下の通りです。

検索機能の強化 全スケジュールとチームスケジュールの切り替え 詳細度に合わせた情報の折りたたみと拡大 時間帯の表示により容易にスケジュール比較 オンコール対応者をシフト時間と共に効率的に表示 アカウントへのアーリーアクセス展開が進行中です。

インシデント対応

ステータスアップデートの通知テンプレート

ステータスアップデートの通知テンプレートがアーリーアクセス可能になりました。この機能により、インシデント対応中の社内コミュニケーションに必要なコンテンツとコンテキストを追加できます。これらの新しい柔軟なテンプレートにより、チームはコミュニケーションにロゴを追加したり、会社の標準に従ってテキストをフォーマットしたりすることができます。このアーリーアクセスプログラムへの参加をご希望の方は、こちらのフォームにご記入ください。

サービスパフォーマンスレポート

PagerDuty Labs Insightsから新しいサービスパフォーマンスレポートが利用できるようになりました。このレポートでは、さまざまなサービスが時間とともにどのようにインシデントの影響を受けているか、マクロトレンドと具体的な詳細について掘り下げることができます。サービスごとのインシデントを時系列で表示する折れ線グラフや、指定した日付範囲に基づく指標を表示するサービス一覧表をご活用ください。このレポートは、今後数カ月間にアップデート展開される4つのレポートの第1弾で、新しいインタラクティブな可視化、直感的なドリルダウン機能、より多くのフィルターオプションなどのUI改良が施されています。今後ともご期待ください。

詳しくはこちら

プロセス自動化

PagerDuty® Process Automationは、お客様がビジネスの全てを自動化し、一貫性を高め、解決時間を短縮できるよう支援します。お客様は、ビジネスシステム全体のITおよび業務手続きを自動化する権限を与えられます。自動化されたプロセスは、指定されたスケジュールに従って実行され、発生したイベントによって自動的に起動し、ステークホルダーはボタンをクリックするだけで安全に実行することができます。

PagerDuty® Process Automationの3つの最新製品に触れる前に、PagerDutyの自動化製品ラインの公式リブランディングについての詳細もご覧ください。Rundeck®やPagerDuty® Process Automation、そして各製品の詳細については、こちらをご覧ください。

PagerDuty® Automation Actions

PagerDuty® Automation Actionsは、PagerDutyのお客様が、インシデントの影響を受けたサービスに対して、ボタンをクリックするだけで、サービスの自動診断と修復を実行できるようにするアドオンです。

PagerDuty® Runbook Automation

これまで「Rundeck Cloud」として発表していた当社のランブック自動化クラウドサービスは、「PagerDuty® Runbook Automation」として、一般提供を開始しました。これは、自動化されたITワークフローを組織内のより多くの人に安全に委ねることで、企業のクラウド運用を加速させるためのSaaS型サービスです。

PagerDuty® Runbook Automationの概要をご覧ください。 PagerDuty® Runbook Automationを使用して、定期的なタスクを自動化する方法をご紹介します。 PagerDuty® Runbook Automationの使用例と利点について、ブログで詳しくご紹介しています。

PagerDuty® Process Automation On-Prem Version 4.0

これまで「Rundeck Enterprise」として知られていた、プロセス自動化の幅広いユースケースをサポートするセルフマネージドソフトウェアは、「PagerDuty® Process Automation On-Prem」という名称に変更されました。

最新の4.0では、以下のような内容が盛り込まれています。

Process Runner。Process Runner(Enterprise Runnerとして発表)は、HTTPS経由でクラスターのエンドポイントにコールバックしてタスクリストを取得するため、ゾーン間のSSHトンネルが不要になります。ファイアウォールの背後に配置され、ノードに安全に接続し、ネットワークゾーン内で自動化タスクを実行するため、最新のゼロトラストセキュリティーモデルに適合しています。 強化されたセキュリティー機能。User Class Management(ユーザークラス管理)、Enhanced Webhook Security(強化されたウェブフックセキュリティー)、User Manager Password Complexity and Password Reset by Email(ユーザーマネージャーのパスワードの複雑性とメールによるパスワードリセット)、Failed Login Rate Limiting(ログイン失敗率の制限)などの機能により、自動化ソリューションに強化されたセキュリティーを提供します。 プラグインの拡張。新しい拡張プラグインは次の通りです。AWS Systems Manager、Azure Active Directory Single SignOn、PagerDuty User Management Job Steps、およびThycotic Key Storage Pluginです。 Enterprise更新とCore Product更新の詳細はこちら 詳しくはリリースノートをご覧ください。

Process RunnerとPagerDuty® Process Automationを使って、多くの顧客のシングルテナントを管理する方法をご覧ください。 詳しくはリリースノートをご覧ください。

Automation + CollabOps

Automated ActionsとSlack用PagerDutyアプリ

Automation ActionsがPagerDuty CollabOpsと統合され、レスポンダーがSlackから直接自動診断と修復を実行できるようになりました。レスポンダーは、インシデントのコンテキストで実行可能な自動化されたアクションを表示し、起動し、自動化されたジョブからの実行状況と出力を確認することができます。このように、レスポンダーはコンテキストを変更することなく、通常業務で使用しているUIで作業を継続することができます。

ナレッジベースへ ブログを読む

Event Intelligence

インシデント通知の自動停止

2月28日より提供されているAuto-Pause Incident Notifications(インシデント通知の自動停止)は、機械学習を応用して、従来から自動解決していた一過性のアラートを検出し、一時停止することができます。ボタンをクリックするだけで、不要なノイズを除去することができます。さらに、APIを活用することで、特定のサービスに対してどれだけの一過性アラートが発生しているかという基本的な統計情報を把握することができます。

詳しくはこちら

パートナーエコシステム

AWS 金融サービスコンピテンシーパートナー

PagerDutyはAWS 金融サービスコンピテンシーパートナープログラムに認定されました。このコンピテンシーにより、PagerDutyは金融サービス組織にとって信頼できるクラウドプロバイダーとしてAWSのウェブサイトに掲載されています。このコンピテンシーは、PagerDutyとAWSがともに、より多くの金融サービス組織がクラウドスケールをフル活用できるよう支援できることを示します。自動化、DevOps、Service Ownershipプロセス、コミュニケーションの合理化を通じて、デジタル運用管理をレベルアップしていきます。

詳しくはこちら

製品廃止のお知らせ

今後予定されている製品廃止について、チームにお知らせください。

Impact Metrics - 2022年2月をもって、Impact Metricsの機能としてのサンセットが完了しました。

V1ウェブフック

サポート終了日 2021年11月13日** V1ウェブフックのサポートを終了しました。この日以降、V1ウェブフックの機能リクエストやバグ修正の受付は行っておりません。 終息日 2022年10月** V1ウェブフックの使用終了日が2022年3月から2022年10月に延期され、現在一般提供されているV3ウェブフックに置き換わります。この日付以降、お客様はV1ウェブフックを使用したり、新規に作成したりすることができなくなります。さらに、V1ウェブフックを使用しているアプリのインテグレーションは機能しなくなるため、開発者は早急にV3ウェブフックを使用するようにアプリを更新することをお勧めします。ただし、V1ウェブフックをベースに構築されたSlack V1は既に非推奨となり、ご利用いただけなくなります。詳しくは、こちらのサポート記事をご覧ください。

V2ウェブフック

サポート終了日 2022年10月** V2ウェブフックのサポートは終了し、2022年10月以降、V2ウェブフックに関する機能リクエストやバグ修正の受付は終了します。 終息日 2023年3月** 2023年3月以降、お客様は新しいV2ウェブフックを作成したり、使用したりすることができなくなります。さらに、V2ウェブフックを使用しているアプリのインテグレーションは機能しなくなるため、開発者はできるだけ早くV3ウェブフックを使用するようにアプリを更新することをお勧めします。ただし、V2ウェブフックをベースに構築されているSlack V2インテグレーションは、2023年1月までの期間限定で利用可能です。Slack V2 Next Generation(V3ウェブフックをベースに構築)をお使いのお客様には影響ありません。 V3ウェブフックへの移行手順の詳細については、こちらのサポート記事をご参照ください。

ウェビナー&イベント

以下のウェビナーやイベントで、PagerDutyの最近の製品アップデートと、それがどのようにお客様に利益をもたらすかについて、より詳しく学んでください。

クラウドと大規模化するITプロセスの自動化を実現する新製品をリリース** PagerDutyの最新ランブック自動化クラウドサービス、異種環境間のITプロセスを自動化する新機能、そしてRundeck by PagerDutyの将来についてご紹介します。 オンデマンドでウェビナーを見る インシデントレスポンス(AIR)の自動化。手動から自動化への道のり** AIRとは何か、AIRが解決する問題とは何か、機械がどのように人間の認知的負担を軽減するのか、手動から予防への道のりはどのようなものか、そしてPagerDuty AIRのパワーを紹介する10分間のデモをお楽しみください。オンデマンドでウェビナーを見る PagerDutyとSalesforceで顧客とカスタマーサービスチームをインシデント対応の中心に** PagerDutyのデベロッパーアドボケイトであるKat GainesとSalesforceのプロダクトマネジメントシニアディレクターであるNoopur Bakshiから学びましょう。また、PagerDutyとSalesforceがどのように重要なカスタマーサービスチームが顧客対応をしているか、顧客フィードバックをレスポンス時間の改善に使うメリット、そして顧客フィードバック、カスタマーサービス組織、バックエンドエンジニアリングチーム間のコミュニケーションとコラボレーションの壁を取り払い、顧客に影響のある混乱を解決しているかをご紹介します。ウェビナーはオンデマンドでご覧いただけます。

今後開催されるイベントのお申し込みはこちら

PagerDuty Community Twitch Stream

PagerDuty Twitch StreamとPagerDuty Community Twitch StreamのTwitchチャンネルで、デベロッパーアドボケートが率いる最新のストリームに参加してください!過去のストリームはYouTube Twitch Streams Channelでご覧いただけます。

登録すると、ライブのお知らせや過去の録音を見ることができます。 放送を見逃しましたか?最近のTwitch配信やYouTube動画をご覧ください。 2022年2月10日 Mandi Walls、Frank Emeryと共に - イベントルールをネストしたイベントオーケストレーションに隠された数学と楽しさ 2021年12月15日 Mandi WallsとJason Flintと - 施設と危機対応のためのPagerDuty

もし、チームでこれらの機能拡張を活用できそうだったら、ぜひアカウントマネージャーに連絡して、14日間の無料トライアルに申し込んでください。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。

2022年3月29日  (更新日:2022年9月9日)    |    インテグレーション&ガイド

セルフマネージドオートメーションとSaaSオートメーションの選択における5つの考慮点

新しいものよりも伝統的なものの方が良い場合があります。ニューコークよりコカ・コーラ クラシックが好きな人もいるし、普通のトマトより伝統野菜としてのトマトが好きな人もいます。

クラウドコンピューティングについても、同じことを言う人がいるかもしれません。「(アプリやデータを)クラウドに置くのは嫌!自前のデータセンターで自分で動かした方が、より(安全だ、信頼性が高い、安い)から」。

話を戻します。私たちの新しいSaaS製品であるPagerDuty® Runbook Automationよりも、PagerDuty® Process Automation On Prem(以前はRundeck Enterpriseとして知られていました)のセルフマネージドバージョンを選択する正当な理由があるのです。昔のものの方が良いというのは今回は当てはまりません。Rundeckのオープンソースプロジェクトで開発された同じコードを使用しています。この場合、SaaSの自動化ソリューションが提供できる以上の柔軟性があれば、あなたの要件やユースケースをよりよく満たすことができるかもしれないということなのです。

どちらにするか迷っていますか?ここでは、あなたのユースケースに適したオファーを決めるのに役立つ5つの考慮事項を紹介します。

  1. アプリケーションとインフラはクラウドではなく自己管理か

アプリケーションとそのスタックは、自社のデータセンターや、クラウドのハイパースケーラー以外のホスティングプロバイダーで稼働しているかもしれません。これは、アプリケーションが最初にデプロイされたのがレガシーな理由であり、クラウドへの移行に投資するには戦略的すぎる(または戦略的でない)ことが原因である可能性があります。また、パブリッククラウドでは実現が困難な特殊な要件(いくつかを以下で説明します)がある場合もあります。簡単に言えば、あなたの会社がITに資本を投下し、専門性を高める場所を選択しているかどうかを反映しているのです。実際、自社でインフラを運用することがコスト抑制や収益性の源泉になる場合もあります。AWSの売上総利益率は60%以上と言われています。最後に、あなたの会社はデジタルサービスを大規模に提供しており、自社でインフラを運用することは、品質の確保やイノベーションのスピードアップの一環であるのかもしれません。

PagerDuty® Runbook Automationは、あらゆるクラウド環境またはセルフホスト環境に安全に接続できるように構築されており、多くの典型的なユースケースに対応することができます。しかし、チームのスキルセットが自己管理環境に向いている場合、PagerDuty® Process Automationソフトウェアを自分で実行する方がより理にかなっている可能性があります。このような場合、PagerDuty® Process Automation On Premを実行することで、経験豊富なエンジニアが専門知識を活かしてセルフサービスの自動化を構築し、それを他のユーザーに委ねることができるため、社内業務の拡張に役立ちます。PagerDuty® Runbook Automationをリモート環境に接続するのと同じ安全な接続性により、チームは異種のデータセンターを安全に接続して集中型自動化を行うことができます。実際、これらの環境へのリモートSSHアクセスを許可する必要性を削減または排除することで、セキュリティーをさらに向上させることができるかもしれません。

  1. より厳しいコンプライアンス基準を満たす必要があるか

HIPAA、PCI、FedRAMPの要件に適合する必要がありますか?ITプロバイダーがSOC2に準拠していることを要求していますか?もしそうであれば、少なくとも短期的には、SaaSを利用するよりもPagerDuty® Process Automation On Premを運用する方がよいかもしれません。

PagerDuty® Runbook Automationはこのような標準に準拠するように構築されていますが、私たちはこの3月にローンチしたばかりです。このような標準を達成するには、ある程度の運用実績が必要です。PagerDuty®には、高品質のサービスを構築してきた大きな経験があり、PagerDuty® Runbook Automationの開発にも活かされています。SOC2認証の取得については、できるだけ早く発表したいと考えています。より多くの認証の取得に近づくにつれ、予想される利用可能性をお伝えしていきます。

  1. データ主権要件に該当するか

多くの国では、個人を特定できる情報(PII)や財務データなど、国民に関する特定の種類のデータを自国の国境内に保存することを義務付けています。PagerDuty® Runbook AutomationはSaaSとして提供され、インターネット経由でアクセスできるあらゆるITインフラの自動化に利用することができます。ただし、現在は北米でホスティングされており、将来的にはヨーロッパでホスティングする予定です。

もしあなたの会社やアプリケーションがそのようなデータ主権要件の対象となるのであれば、代わりにPagerDuty® Process Automation On Premを利用することが理にかなっていると言えるかもしれません。私たちのSaaSサービスは、ユーザーアカウントに必要なもの以外の個人データを直接保存しません。しかし、作成するオートメーションがこのような規制の違反につながる可能性がある場合、自社のインフラ内に自社の自動化環境をホスティングすることで、コンプライアンスを示すことが容易になる場合があります。

  1. オートメーションに組み込むべきインフラとは

PagerDuty® Process Automation On Premは、PagerDutyが開発しサポートするプラグインと、Rundeckオープンソースコミュニティーが開発するプラグインの両方を幅広く提供します。これはオートメーション開発者がいくつかの種類のインフラをオートメーションに取り入れるための選択肢と柔軟性を提供します。

コミュニティーで非常に多くのプラグインが利用可能な理由の1つは、PagerDuty® Process Automation On Premが柔軟なプラグインAPIを備えていることです。これにより、ノード、ジョブステップ、UI統合、クレデンシャルストレージなど、ジョブ定義に利用したい自社製またはあまり一般的ではないインフラのための独自のプラグインをユーザーがシームレスに開発することができます。

PagerDutyは、厳しいセキュリティーと信頼性の要件を満たすために、当社のSaaSサービスであるPagerDuty® Runbook Automationを運営しています。つまり、私たちが提供できるプラグインは、これらの要件を満たすためにテストされ、認定されたものだけです。同じ理由で、カスタムプラグインも現時点ではサポートされていません。

PagerDuty® Process Automation On Premでファイアウォールの内側で使用するには十分安全ですが、PagerDuty® Runbook Automationではサポートされていないプラグインの一覧はこちらです。

自動化したいインフラの種類が多い場合、PagerDuty® Process Automation On Premが豊富な要件を満たす柔軟性を備えていることがお分かりいただけると思います。

  1. どのようなセキュリティー要件に対応する必要があるか

PagerDuty® Runbook Automationは、厳しい要件を満たすために強化されたセキュリティーで構築されており、セキュリティーとコンプライアンス要件への準拠を最適化することができます。例えば、PagerDuty® Runbook Automationは、HTTPSを使用してエンドポイントにコールバックするRunnerを使用してインフラに接続します。このため、ファイアウォールに追加のポートを開く必要がありません。Runbook Automationは、Okta、Ping、Azure ADなどのクラウドSSOや、Hashicorp Vault、CyberArk、Thycoticなどの機密管理SaaSサービスと統合されています。特権的なアクションへのアクセス制御を容易にし、スーパーユーザー資格情報を配布する必要性を低減します。ジョブレベルのログは、コンプライアンス監査も容易になることを意味します。しかし、秘密管理の場合、PagerDuty® Runbook Automationはオンプレミスのキーストアと接続しません。

しかし、あなたの会社のセキュリティー要件に合致するでしょうか?

オンプレミス認証や機密情報管理と統合する必要がある場合、またはこの分野で独自のニーズがある場合は、代わりにPagerDuty® Process Automation On Premが提供する柔軟性が必要かもしれません。

概要

PagerDuty® Runbook AutomationPagerDuty® Process Automation On Prem
最適な目的クラウドやSaaSの運用を管理するためオンプレミスの運用やインフラを管理するため
プラグインプリセットとカスタムなし全て利用可能+カスタム可能
キーストアクラウドのみオンプレミスまたはクラウド
データPDによる管理お客様による管理
アップグレードPDによる管理お客様による管理
スケールPDによる管理お客様による管理
安全なインフラPDによる管理お客様による管理

これらの違いについて、自社の要件と照らし合わせてみたいという方は、ぜひ私たちのチームと会話を始めてください。 この記事はPagerDuty社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。