Blog
ブログ

2018年2月25日  (更新日:2022年3月9日)

Dynatraceインテグレーションガイドを追加しました

Dynatrace はアプリケーションとサービスを監視し、問題を分析し、問題が発生したときに通知します。また、Dynatrace はアプリケーションアーキテクチャ全体を自動的に学習し、適切な視覚化をインテリジェントに選択して提供することで、データや環境を容易に理解できるようにします。カスタマイズされたインフォグラフィクスは、アプリケーション環境のあらゆる側面に関する最も重要な事実を伝えます。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年3月19日  (更新日:2022年3月9日)

Pingdom Webhooksインテグレーションガイドを追加しました

PingdomはWebサイトやインフラの死活や稼働時間を監視できる簡単で便利なツールです。PagerDutyにアラートを電子メールまたはwebhook経由で送信するように設定すれば、PagerDutyの包括的なアラート機能とインシデント追跡機能を利用できるようになります。PagerDutyは、既存のPingdomのチェックに双方向電話、SMS、電子メールアラートを追加します。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年2月7日  (更新日:2022年3月9日)

Splunk インテグレーションガイドを追加しました

Splunk は、ネットワークトラフィック 、Webサーバー、カスタムアプリケーション、アプリケーションサーバー、ハイパーバイザー、GPSシステム、株式市場フィード、ソーシャルメディア、既存の構造化データベースなど、想像以上のあらゆるソースからデータを収集し、索引付けします。インテグレーションにより、Splunkのネイティブwebhookを使用してPagerDutyにアラートが送信されます。

詳しくはこちら

続きを読む
インテグレーション&ガイド
2018年8月30日  (更新日:2022年3月9日)

LGBTQ+グループ向けのPagerDuty Summit参加プログラム

私たちは、PagerDutyのインクルーシブな企業文化を非常に誇りに思っています。 それは当初から私たちがビジネスのコアに置いている価値であり、多様なチームを持つことはより多くのイノベーションにつながることを実地で知っています。

今後のPagerDuty Summit 2018を含めて、私たちの活動がすべて同じインクルージョンの精神を背景としていることを確認したいと思います! PagerDuty Summitは、ベストプラクティスを学び、実践的なトレーニングを受け、業界のリーダーからDevOpsの未来を聞く場所です。 私たちの目標はこのサミットを、すべての人種、民族、性別、年齢、能力、宗教、性的指向、軍関係、背景を問わず、最もインクルーシブなサミットにすることです。

私たちは、今年のサミットへ技術に触れる機会があまりない人たちのための無料パスを100枚予約しました。 そうです、この2日間の全カンファレンスで、私たちのセッションやイベントにすべて無料で入れます – 無料です!

応募するには、 このフォームに必要事項を記入して提出してください (注:英文です)。

Summit Details:

2018年9月11-12日

ウェスティン セントフランシス、サンフランシスコ

応募適格**:

女性、有色の人々、能力の異なる人々、LGBTQ +、退役軍人/軍隊の兵役、予備軍を含み、これに限定されない、技術産業や技術コンファレンスに参加した経験があまりないグループのメンバー

ご自身で旅行や宿泊施設を予約できること

18歳以上

私たちの行動規範に同意できること

抽選は、資格基準を満たすこと、完全な書式を提出することで、先着順に行われます。 選ばれた人は、完全なフォームを提出してから8営業日以内に電子メールで通知されます。 ご関心をお寄せいただきありがとうございます。お会いできますように!

*無料パスはサミットのみで、PagerDuty Universityは含まれていません。

本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。

続きを読む
ニュース&告知
2018年9月11日  (更新日:2022年3月9日)

PagerDuty Summitで新製品のイノベーションをチェック!

今年のPagerDuty Summitは私にとっては3度目ですが、最高のものになることを願っています! このカンファレンスは、サンフランシスコのユニオンスクエアにあるシンボル、ウェスティンセントフランシスホテルで開催され、2日間にわたり業界のリーダーやあなたのような人々の現実のストーリーやベストプラクティスなどを紹介します。参加する人々は、デジタルトランスフォーメーションとよりスマートなリアルタイムオペレーションを推進するために、日々各組織の担当をリードしています。

テクニカル、ビジネスバリュー、製品という3つのトラックにまたがる24セッションでは、誰にとっても有益な情報があります。特に製品トラックのいくつかには素晴らしい情報があります。PagerDutyを最大限に活用する方法を学ぶことができます。 さらに重要なのはこれらの製品を構築する際にパートナーとなった実際の顧客から直接聞くことでしょう。優れたサービスとチームの幸福の両方を提供する能力の上ですでに達成した、数字の裏付けのある利点を共有してくれるからです。

ここでは、製品トラックの中を覗いてみましょう

オペレーションのリアルタイム・ビジネスへの影響

VodafoneのデジタルIT担当責任者、Ben Connolly氏は、 PagerDutyはDevOpsや文化の変革を推進する重要なパートナーです。サミットで発表する新製品のおかげで、Benと彼のチームは、技術的な問題がデジタルサービスやビジネスパフォーマンスに及ぼす定量的な影響を直接リアルタイムで把握できるようになりました。

ビジネスの成熟度の定義と測定

今日のデジタルビジネスとITのリーダーは、人やプロセス、テクノロジーへの投資を優先させるために、業務と業績のつながりを理解する必要があります。 しかし、現実に理解している人はまれで、何を測定すべきかも分からないことがよくあります。 Castlight Healthのレジリエンスエンジニアリング担当ディレクターのCad Oakley氏は、PagerDutyの最新製品の1つが、チームが運用の成熟度を測定し、加速するための規範的な方法をどのように提供しているかを共有します。

最新のインシデント対応によるベストプラクティスの自動化

デジタルビジネスはこれまで以上にビジネスの変化に適応しており、効果的なインシデント対応はあらゆる組織にとって重要な機能となっています。 できるだけ早く問題を解決するためには、技術チームは適切な人材を即座に動員しなければなりませんが、たいていは言うほど簡単ではありません。William Hillの ITオペレーション担当ディレクターであるAlan Alderson氏は、PagerDutyがインシデント・ライフサイクルの各段階でベスト・プラクティスと自動化を適用してシグナル・アクション間の悩みを解消する方法を共有します。

HumanOps:ピークパフォーマンスの達成

ITオペレーションテレメトリーは、常にサーバー、アプリケーション、および技術サービスの健全性に重点を置いてきましたが、これらのすべての品質を実際に支えているのは、その背後にいる人々です。 当社のDigital Insightsチームは、PagerDutyのオペレーション・ヘルス・マネジメント・サービスがITオペレーションに対して、かつてない人的要因の視覚化機能をどう提供しているかを紹介します。

開発者向けPagerDuty

柔軟なAPIと開発ツールを使用してPagerDutyプラットフォームをユニークで興味深い方法で拡張していることがわかった時、私たちは非常に興奮しています。 このセッションでは、 Xeroのサイト信頼性エンジニア、Abdullah Siddiqui氏のような人々がPagerDutyの上に構築した最もクールなサードパーティツールを紹介します。 また、プラットフォームチームのプロダクトマネージャーやエンジニアと直接連絡して詳細を学ぶ機会もあります。

デベロッパーズ・トランスフォーメーション:PagerDuty Journey

信頼性は、PagerDutyで行っているすべての心臓部にあります。 しかし、継続的なアベイラビリティを提供し、迅速なイノベーションで顧客のニーズにマニアックな焦点を当て、指数関数的に拡大するスケールをサポートするために、私たちは製品の開発と運用の方法に多大な投資と変更を加えなければなりませんでした。 このセッションでは、PagerDutyのエンジニアリングヘッド、Tim Armandpourから、開発チームのベストプラクティスと洞察を分かち合うことができます。

製品に関するAMA(Ask Me Anything)

PagerDutyでは、顧客からのフィードバックを得ることが大好きです。 私たちと共有するのを待てない機能がありますか? 将来の拡張について聞いてみたいですか? 当社のHead of Rachel Obstlerと製品チームのさまざまなメンバーとのライブトークに参加してください。

これは3つのトラックの1つです! 今年はSummitで学ぶべきことがたくさんあります。そして、この素晴らしいコンテンツといっしょを逃さないでください。 席を確保するために今すぐ登録してください!

本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。

続きを読む
ニュース&告知
2017年12月26日  (更新日:2022年3月9日)

オムニチャネルで成功しているリテーラーのDevOpsを学ぶ

ウォルマートのようなリテーラー( 小売業者)の増加に伴い、eコマースとリテーラーの間の戦いが収束しつつあり、Amazonのようなeコマース企業の多くはオフラインでのプレゼンスを確立しています。この2方向の展開をサポートするため、リテーラーとeコマース企業は、優れたオムニチャネルカスタマーエクスペリエンスを提供することを目指しています。

リテールの世界のオムニチャネル

顧客は、店舗内、Webサイト内、モバイルアプリ内、またはソーシャルメディア内の全チャンネルでシームレスな体験ができると期待しています。世界最先端のリテールブランドはトレンドに乗っており、たくさん成功事例があります。以下は、オムニチャネルのリテール体験を提供しているブランドの好例です:

ディズニー:ディズニーランドでの休暇を計画するのは大変です。しかし、ディズニーのWebサイトやモバイルアプリのおかげで、レストランや観光スポットなど、休暇全体をオンラインで計画することができます。また、各アトラクションの待ち時間を知ることもできます。

スターバックス:スターバックスの特典カードを使えば、コーヒー代でキャッシュを使い切ることはありません。モバイルデバイスから簡単に特典カードを取り出して、いつでもカウンターで使えます。

ノードストローム:ノードストロームは、顧客がiPhoneアプリで行う注文を店内のスタッフが補助することで、優れたカスタマーエクスペリエンスを提供しています。各スタッフはアイテムの在庫を確認でき、特定のアイテムが在庫切れの場合、すぐにiPhoneで予約して顧客の家に届けることができます。顧客はオンラインで商品を購入して店頭で持ち帰ることもでき、返品も簡単です。

これらのチャネルでのエクスペリエンスをサポートするためには、深くよく統合されたバックエンドと、一貫したフロントエンドインタフェースが必要です。しかし、これは以前よりもずっと簡単になりました。従来のインフラストラクチャ、ツール利用、そして開発プロセスを放棄して、リテールアプリケーションを構築するための最新のDevOpsアプローチに移行すればよいのです。顧客は絶えず新しい機能や体験を求めており、そのために頻繁になる更新は、安定性を損なうことなくアジャイルさと正確さを最大化する方法で展開する必要があります。これは、デジタルチャネルと物理チャネルをシームレスに統合したエクスペリエンスを構築するために不可欠です。何千もの日常的なやりとりは破綻を生じやすく、また、人気ブランドはサイバー攻撃の目標とされやすいです。何百万人ものユーザーをサポートするためには堅牢なシステムが必要です。システムの可用性とセキュリティを確保する必要があります。これは簡単な仕事ではありません。

いかにしてDevOpsチームがオムニチャンネルリテーラーをサポートするか

インフラストラクチャ層から始めて、アプリケーションスタックまで移動し、オムニチャネルのリテールアプリケーションを構築する際に、DevOpsチームが留意べきことを理解しましょう。

クラウドに移行する

モバイルは、オムニチャンネルのリテールを考える際に最も重要なメディアです。これは、顧客にアプローチする最も個人的かつ強力なチャネルです。どこにいても、お客はあなたの会社とやりとりして、都合のいいときに買うことができます。しかし、ほとんどのリテールアプリは、過去に使われていたクライアントサーバモデルをベースにしていて、現代の最先端の消費者をサポートすることはできません。複数のデバイスやモバイルオペレーティングシステム用のアプリケーションを構築するには、クラウドテクノロジーを活用する必要があります。しかし、いくつかのクラウドツールをあなたのレガシーなスタックに投入するだけでは足りません。AWS EC2などのクラウドサーバでアプリケーションを実行したり、AWS S3などのブロックストレージにデータを格納したり、Sauce Labsなどのクラウドベースのテストプラットフォームを使ったり、Prometheusなどのクラウドネイティブな監視ツールを使ったりする場合は、全システムをクラウドで稼働させるか、少なくともそこへの移行を開始しなければなりません。

マイクロサービスモデルにゆっくりと移行する

マイクロサービスは、単一のモノリシックなアプリケーションを、小規模なクロスファンクショナルチームによって開発・管理される小さなサービスに分解するアプローチです。このタイプの複合型のシステムにより、新しい機能をより早くリリースできます。さらに、あるサービスに障害が発生しても、システム全体をダウンさせることはありません。しかし、マイクロサービスへの移行は、一度に1ステップで行う必要があります。最初のバッチが安定した後に、いくつかの機能を切り分けてください。マイクロサービスアプリは、従来のツールセットを使用する場合に限り、管理が難しくなります。幸いにも、DockerやKubernetesのようなコンテナ技術は、マイクロサービスの管理を容易にしています。

VMからコンテナへの切り替え

クラウドへ移行することが最初にやるべきことです。クラウド内にもう移行していても、アプリをコンテナで実行することが重要です。マイクロサービスモデルに移行すると、サーバインスタンスごとにハードウェアハイパーバイザとOSのオーバーヘッドがアプリのパフォーマンスを低下させます。マイクロサービスアプリケーションを拡張するには、コンテナにコードをパッケージ化する必要があります。コンテナ化すると全く新しいツールセットを使うことになります。たとえば、Kubernetesのようなオーケストレータを活用して、数千のコンテナを管理する必要があります。幸いなことに、コンテナ周辺のツール事情は昨今急速に成熟しました。今日、多くの世界クラスのアプリは、コンテナを使用して確実かつ安全に稼動しています。業界は、クラウドネイティブコンピューティングファウンデーション(CNCF)が認めた標準規格を整理統合しているところです。

分散データストア

インシデント管理でシステムを保護する

現代のマイクロサービスベースのコンテナ駆動型システムでは、多くのパーツがあり、これらのパーツはしばしばフェイルします。DevOpsの呪文の「早く進んで前向きに失敗する」とは、これらの失敗にすばやく反応し対処できる必要があることを意味します。パフォーマンスとセキュリティの両方が、オムチャンネルのリテールアプリの最大の課題です。サイバー犯罪者は多数のユーザーを持つアプリに引き寄せられますが、リテールアプリは名前、住所、クレジットカード情報などの価値のある重要なユーザーデータを数十億単位で持つことが知られています。システム障害やサイバー攻撃から守るには、データポイントを集中管理し、問題に応じて適切な対応者をリアルタイムで把握するインシデント管理システムが必要です。

大規模なDevOpsチームでは、重要な通知が失われる可能性があるため、適切なメッセージが適切な人に届くようにルーティングシステムが必要です。インフラストラクチャの複雑さが増し、大量のデータを処理する必要があるため、機械学習を活用してデータを理解し、重要なポイントに人々が集中できるようにするソリューションが必要です。オムニチャネルリテール向けのインシデント管理ツールは、システム全体にわたる監視、チケット発行およびその他のデータソースを相互に関連付け、集中化することができます。最先端のインシデント管理プラットフォームにより、疑わしいパターンを特定し、インシデントがエスカーレートする前に適切な人材を確保できます。

オムニチャネルのリテールは単純ではないので、完璧なシステムを構築するためには数年以上の時間が必要です。ただし、ここに記載されている方法とツールは、DevOpsチームにオムニチャネル体験を提供するための手がかりを与えることになります。クラウドへの移行、マイクロサービスの活用、コンテナの採用、データストアの分散化、またはインシデントの予見的な管理など、次世代のコンピューティングテクノロジーが今や利用可能です。リテールビジネスに必要なのは、計画を立て直す準備を整えた開発チームだけです。

続きを読む
DevOps
2017年12月15日  (更新日:2022年3月9日)    |    DevOps

DevOps監視は複数のツールの組み合わせで

監視ツールはDevOps チームの人生を楽にします。正しいDevOps 監視ツールを選択することで、効率的なワークフローとエンドユーザーの幸せを手に入れることができます。

多様なDevOps監視ツール

ほとんどの開発チームのための通常の監視ツールキットには、次のものが含まれます(ただしこれに限定されません)。

インフラ監視ツール アプリケーション・パフォーマンス・モニタリング(APM)ツール ログ解析ツール

各レイヤーに目を通し、あなたのDevOps監視プロセスにどこにフィットするか見てみましょう。

インフラストラクチャとネットワークの監視

これらのツールは、サーバ、ルータ、スイッチなどのインフラストラクチャとネットワーク全体を監視できます。インフラストラクチャ監視ツールは、重要なビジネスプロセスに影響を与える前に、ITインフラストラクチャの問題を特定し解決するのに役立ちます。また、古いシステムで障害が発生する前に、アップグレードの計画を立てるのに役立ちます。インフラストラクチャとネットワークの監視ツールは、メンテナンスの停止がユーザーに与える影響を最小限に抑えます。

インフラストラクチャの健全性を監視することで、インフラストラクチャ上で実行されているアプリケーションの正常性を把握できます。ただし、これらのツールはアプリケーションを完全な一連のサービスとして監視しません。その意味で、今日のクラウドアプリケーションには適していない従来の監視方法を採用しています。

例:Nagios、Zabbix

アプリケーションパフォーマンスの監視

アプリケーション・パフォーマンス・モニタリングツールは、その名前が示すように、アプリケーションのパフォーマンスを監視します。アプリケーションの動作を可視化し、ユーザーに影響を与える問題を検出し、それらの問題を迅速に解決するのに役立ちます。エンドツーエンドのアプリケーションフローを監視し、コードレベルの詳細を含むトレースを提供します。APMツールの診断には深い洞察が含まれており、パフォーマンスの低下や障害の原因となる可能性のある正確なコード行を見つけられます。

APMツールはパフォーマンスの向上、処理速度低下とダウンタイムの防止に役立ちますが、APMだけでは解決できない、さらに深いトラブルシューティングが必要な問題もあります。これらの問題には、ログファイルのインデックス付けと検索が必要です。残念ながら、APMツールはログファイルを分析せず、セキュリティ攻撃を検出できません。この種の分析には、ログ解析ツールが必要です。

例:AppDynamics、New Relic、

ログ解析

ログ解析ツールは、ログファイルを格納しインデックス付けするスケーラブルで信頼性の高い方法を提供します。ファイルをすばやく検索し、ログデータに基づいて詳細な分析を作成し、セキュリティ違反やサイバー攻撃を監視することができます。ただし、エンドツーエンドのアプリケーションパフォーマンス監視は提供されず、コードレベルのトレースを明らかにすることもできません 例:Splunk、Elastic Stack

これらのツールは、エンドツーエンドの監視のためのものではありません。インシデントが発生したときにこれらのツールのいずれか1つだけを使うと、解決の鍵となる部分が欠けることがあります。

監視ツールにはさらにその監視が必要

監視のためにこれらのツールを全て採用したとしても、インシデントが発生したときに混乱を招く可能性があります。これらツール全てからの警告は、重複するデータをたくさん提供します。これにより、あなたはツール間を行き来してあちこち見回することになり、チームだけでなく顧客にも多くの不満を引き起こす原因になります。ツールセット全体からのデータのオーバーロードに直面するので、MTTRは長くなります。インシデント管理での監視を簡素化が必要なのです。

監視ツールを集約する単一のインシデント管理プラットフォームが必要

ITチームやDevOpsチームは、互いに深く統合されたベスト・オブ・ブリード(複数ベンダーの組み合わせ)のツールを使用した監視を長年受け入れてきました。これらの全ての監視ツールを使用すると、矛盾する情報と膨大なアラートが表示されることがあります。その全てを管理し、問題の概要を把握するためのセンターハブが必要です。PagerDutyのようなインシデント管理プラットフォームは、インシデントが発生した際の混乱から秩序を回復するために不可欠です。

インシデント管理ツールは、優先度の低いアラートを抑制し、適切な人に適切なタイミングで優先度の高いアラートを表示することで、ノイズからシグナルを引き出します。インシデント管理ツールは、その他の監視システムと深く統合されているため、あらゆるDevOpsチームが必要とする真のエンドツーエンドの監視が可能です。十分に錬られた通知オプションを使用すると、PagerDutyなどのインシデント管理ソリューションはチームに自分たちへの通知方法を選択させることができます。さらに、これらのプロセスを自動化することで、解決までのの時間を大幅に節約し、全体的なMTTRを削減できます。

全ての監視ツールにはそれぞれ独自の機能が用意されていますが、全体を管理していないと混乱が生じます。1つで全てをカバーできるDevOps監視ツールはありませんが、1カ所から全ての監視ツールを管理して、送られてくるデータをフィルタできるPagerDutyのようなソリューションを使えば、完璧に一歩近づくことができるでしょう。

2018年1月18日  (更新日:2022年3月9日)    |    DevOps

DevOps:開発者の視点から

「オペレーションルームに歩いて行く – もうこれ以上何もする必要はないと思う」

開発者のための最新の機能のリリース(訳注:英語サイトに飛びます)で、PagerDutyのシニアエンジニアDavid Yang氏と私は、私たちの内部アーキテクチャが単一のモノリシックなコードベースから数十のマイクロサービスの組み合わせにまで進化していくのを見てきました。

彼は、8000人以上のPagerDutyの全顧客にアラート通知を送信するサービスを所管するIncident Management – Peopleチームのテクニカルリーダーです。私たちは座って、彼らのサービスの運用について彼のチームがオーナーになるよう切り替えた後の生活について話しました。 私たちが見た利点と欠点に関するいくつかの観察を紹介します。

今はチームがサービスのオーナーになっています

開発者がサービスのオーナーになるモデルに移行して以来、開発者の独立性はますます高まっています。副作用は、インフラストラクチャのプロビジョニングと管理の難しさを最小限に抑えられたことです。現在、チームは邪魔と障害を最小化するように最適化したいと考えています。 インフラをサポートするチームは、人間の介入の必要性を最小限に抑えるために優れたセルフサービスツールを提供することに重点を置いています。

開発者がコードのオーナーになると、サイクルタイム、つまり「これは問題だ」というメッセージがどこかで表示されてから実際に問題を解決するまでの時間が短縮されます。これは非常に価値があります。

文化面での変化は

人々がより多くのコードのオーナーになり、自分たちが運営するシステムのために一般的にはより多くの責任を負うようになると、道を邪魔するものを排除することを重視する文化が広がります。各チームは、 「自分が今まで、あるいは将来ブロックされていないことを確認するにはどうするか」という考え方に向かって最適化されます。ブロックされるともっとはっきり分かります。以前は、ホストをプロビジョニングするたびに私は毎回運用チームに問い合わせなければなりませんでした。 私のチームは他のチームの障害物で隠されていないため、自分たちの障害物をよりはっきり見ることができます。

私たちには、エンドツーエンドの顧客価値を提供するプロセスのすべてを所有することに重点を置いたチームがあります。これは非常に貴重です。

インシデント対応プロセスではどうに役立つ?

サービスのオーナーシップの境界が明確になっています。運用の問題が発生した場合に、影響を受けるチームを簡単に特定できます。そして、自分が従うべき正しい手順、例えばそれは「これがそのチェックリストです」という客観的な手順ですが、それを知っているということが大事です。 これによって問題の解決に100%集中し、インシデント前後のコミュニケーションに集中することができます。

それほどうまくいかなかったことも

サービスのオーナーになっていても、そのサービスに問題が発生しないとは限りません。当社のサービスの運用維持に専念するためには、そのためだけに使う時間が必要です。 これが結局はチームの時間の多くを占めます。特に知識のギャップがあるレガシーサービスで問題になります。 当初は、私たちのスプリントでの作業性を守るために十分なガードレールを設置していませんでした。 これは客観的な意思決定を可能にするためにKPI(特定のスケーリング目標や運用負荷レベルなど)を活用することで改善されています。

将来は?

[業務関連のワークロードと機能開発ワークのバランスをとるため]各チームは、メトリックによって客観的な意思決定を推進するために、次のように問い続けています。「私はこうした道具を日常的にどう活用していますか? どのようにして客観的な意思決定を行うのですか?」と。

組織内の業務の中で変更を実行しようとすると、多くのコラボレーションが必要になります。 適切なメトリックが何であるかを把握し、それらのメトリックについて議論することも必要です。

2018年6月6日  (更新日:2022年3月9日)    |    インテグレーション&ガイド

Detectifyインテグレーションガイドを追加しました

DetectifyはSaaSベースのWebアプリケーションサービスで、Webサイトのセキュリティステータスを分析し、結果を含むレポートを作成します。 このインテグレーションによって、システム管理者またはサポートチームにアラームを直接送信することができます。

詳しくはこちら

2018年5月7日  (更新日:2022年3月9日)    |    インテグレーション&ガイド

Desk.comインテグレーションガイドを追加しました

Desk.com PagerDutyアプリケーションでは、PagerDuty内でインシデントをトリガすることができます。 これにより、数時間後でもチームに通知を送信できます。 PagerDutyシステムでは、チームのメンバーに通知する方法と時期を設定できます。

詳しくはこちら

2017年12月19日  (更新日:2022年3月9日)    |    DevOps

DevOpsへのよりディープな監視の導入

継続的インテグレーションのポイント は、ビルドとテスト を自動化し、効率と品質を開発パイプラインにもたらすことです。しかし、継続的インテグレーションプロセスに伴って頻繁な更新が行われると、状況が悪化してしまうことがあります。

重大なインシデントや何か悪いことが起こるとパニックになります。それがインシデント管理のよくある風景です。しかし、何かが起きた後に常にそうなるでしょうか。初めからインシデント管理を継続的インテグレーションプロセスに組み込むことで、アカウンタビリティ、可視性、透明性を全く新しいレベルに引き上げることができます。

ここでは、いかにしてDevOpsへの深い監視を行い、それがアプリケーション開発方法を変革するかについて説明します。

コードの品質に対する責任は 継続的インテグレーションフェーズから始まります

DevOpsの目標は、開発チームと運用チームの協力を促進し、お互いのニーズを理解し、状況が悪化したときでも相手の責任を追求するのではなく共に解決することです。稼働時間の向上は必ずしもOpsチームだけの役割ではありません。DevOpsでは、新たに加わった開発者でさえ稼働時間に責任を感じ、ダウン時には協働することができるはずです。

継続的インテグレーションを実装する大きなメリットのひとつは、開発チームと品質管理チームの両方が出荷品質のコードに対して責任を負うことです。新しいビルドがコミットされるたびに、一連の自動ユニットテストによってコードが検証されます。インシデント管理がこのレベルで実装されていれば、何か不具合が発生した場合には適切なデータが手元に残るため問題を効果的に解決できます。こうして、誰も責めずに、パニックに陥ることもなく迅速にトラブルシューティングを行うことができます。インシデント管理を導入すれば高い品質を求める文化が醸成され、開発チームと品質管理チームは互いに可用性に責任を負うようになります。

緊急医療チームと同じように、責任者が現場に到着する前に最初に働く初心者のエンジニア、つまりオンコールエンジニアを待機させることも良いでしょう。この責任の文化を醸成するには、監視データをチーム間で見えるようにするモニタリングとオンコール管理システムが必要であり、公平なシフトに基づいて計画外の作業を分担する必要があります。

開発チームと運用チーム間の可視性

チーム全体の取り組みと進行状況を把握することで、誰もが自分の仕事に集中できるようになります。多くの企業は、悪い事が起こったときやインシデントが発生したときにのみ、Opsチームに新しいコードの実装を任せます。結果として、Opsチームは不信のために変更を控えていると非難され、更新が遅くなります。

Devチームが計画段階から変更点についてOpsチームに情報公開を行っている場合、それがビジネス全体にどのように役立つかを理解することができます。Opsチームに開発フェーズから新しいアイデア、今後の機能、考えられるリスクを認識してもらうことは、チーム全体の意識を高めます。Opsチームは何かあってもいいようにいつも準備ができているため、安心していられます。

早い段階でインシデント管理を実装することで、アプリケーションの健全性と問題が発生したときに何をすべきかを誰もが理解できるようになります。誰もが大きな図式を知っており、より迅速にトラブルシューティングを行うことができます。

透明性には統一された指標が必要

チーム全体が、危機の間お互いの責任を認識しているほど、彼らはより効果的に動き、より速く正常に戻すことができます。

複数のソースからデータを収集し、相関させ、分析することにより、DevとOpsは継続的な洞察を得ることができます。しかし、そのデータは実用的になった場合にのみ価値があります。インシデント管理ソリューションを使用すると、適切な人に問題の全体像を提供し、最終的にはアプリを壊してしまう可能性のある問題をゼロにすることさえできます。

最後に、インシデント管理ツールが問題が起きている時にリアルタイム通知を提供することで、実際に役立つことを確認してください。さまざまな重大度の問題の経路を決めるプロセスを定義することは非常に重要です。データを捨てようとは思いませんが、手元の問題を解決することに貢献しない無意味なメトリックを通知されることは望みません。

DevOpsへのトランスフォーメーションに成功するためには、継続的インテグレーションとインシデント管理が不可欠です。チーム全体にとってたのもしいリリーフとなり、ダウンタイムに対するより迅速な対応が可能になります。インシデント管理によってDevOpsエンジンは故障することなくスムーズに回転するようになります。

2018年2月9日  (更新日:2022年3月9日)    |    インテグレーション&ガイド

Datadogインテグレーションガイドを追加しました

Datadog はメトリックとイベントを1か所に集約してくれるホスト型の監視サービスです。Datadog とPagerDutyのアカウントを統合すると、Datadogのニュースフィードにある@pagerdutyというメンションでPagerDutyにDatadogのアラートを送れます。Datadogのニュースフィードでインシデントやエスカレーションをリアルタイムに追跡することもできます。PagerDutyにDatadogアラートを送信することで、PagerDutyのアラート機能をフルに活用できます。

詳しくはこちら

2018年8月23日  (更新日:2022年3月9日)    |    DevOps

フォースの覚醒:PagerDuty + DatadogでDevSecOps

セキュリティ専門家として長年過ごしてきた私は、Datadogのような企業が、変化するセキュリティ環境にどう対応しているかに常に関心を持っています。 昔はセキュリティ組織がセキュリティの責任を完全に負っていて、ビジネスの周縁(perimeter)を保護することに重点を置いていた、ということも思い出せます。しかし、クラウド、モバイル、Webアプリケーションの出現で、周縁は消えてしまいました。 それと並行して各企業は、セキュリティとは開発チームと運用チームの中で共に責任を担い 、統合されるべきだと認識するようになっています。

それに向き合いましょう:Webアプリケーションに対する攻撃はMenace(脅威。ファントム・メナースから)となっており、毎年急速にデータ侵害が増加しています。 Rogueアクターは、インフラ、ソフトウェア、およびプロセスの弱点を悪用しています。私たちはこれに対してどのようにしてStrikes Backしますか? New Hopeをここに…DevSecOps!

お分かりでしょうが、私は子どものころからスターウォーズの熱狂的なファンです。いつもこの話題のシリーズの新作が発表されるたびにワクワクしています。最新版は私にこの、遠く遠く離れた銀河の(原文はa galaxy far, far away )の教訓がDevSecOpsに関して私に教えてくれたことを思い出させました。

“覚えたことは全て忘れるのじゃ” – ヨーダ

賢明なJedi Masterが言ったこの言葉を言い換えると、あなたがずっと真実だと思っていた知識のいくつかは、いつか偽に変わることもある、と言っていたはずです。DevSecOpsについて言えば、それはトランスフォームの成功を邪魔することもあります。時代遅れのツールとプロセスを使うことで、セキュリティチームが物事を停滞させる可能性があるのです。セキュリティは、組織内のセキュリティのマインドセットを変える一部として調整が必要であり、より新しいツールやプロセスがどれだけ良きパートナーになるかを知っておく必要があります。クラウドアプリケーションの監視サービスであるDatadogは、ツールとプロセスを更新する必要があると認識した企業の1つです。 そのセキュリティチームは開発部隊から学び、PagerDutyをアラートとレスポンスに使用し始めました。 PagerDuty Securityチームの一員として私は、ビジネスに自前のサービスを生かすこと(Eat Your Own Dog Food)も 自分のプラットフォームをセキュリティ業務の一環として使うこともできます。 しかし、なぜでしょうか?

“こいつはケッセルまで12パーセクで飛べた船だ!”- ハン・ソロ

PagerDutyでは、私たちは即応性と応答性を備えたモデルを志向しています。 例えば、セキュリティイベントが発生していたりリソースが準拠していないことをどれぐらい早く発見できるでしょうか?あるいは起きた問題を収めるためにどうに迅速に対応できるでしょうか? といったことです。DevSecOps一部は、セキュリティについてスピード面でスケールする自動化された決定をすることです。 ミレニアム・ファルコンが光速で飛ぶほどは速くないかもしれませんが、迅速に対応できることは、潜在的なコスト削減とリスクの削減につながります。 スピードが要(かなめ)なんです!

すべてのリリースが100%安全で、100%稼働率を達成していると言えればよいのですが、現実にはありえません。現実では問題が起こり、どのくらい迅速に対応できるかが収益に影響します。 2017 Ponemon Cost of Data Breach Study は、インシデントレスポンスチームを組織することで、レコードあたり最高19ドル分の損失を削減できることを示しました。 適切な人にアラートして迅速に関与させることが重要です。

PagerDutyでは、クラウド内でマルチテナントのSaaS(software-as-a-service)プラットフォームを運用し、さまざまなツールを使用してインフラストラクチャを監視および保護しています。 これらのツールは、私たちが採掘してフィルタリングできる多くのシグナルを生み、PagerDutyプラットフォームとのインテグレーションにより、関連するセキュリティイベントとアラートをまとめることができます。 これにより、イベントに即応して、 インシデント対応プロセスを開始し、迅速に対処と復旧ができるようになります。

これはセキュリティインシデントに限りません。 開発者がコードを所有している環境では、クラウドインフラ内のリソースがコンプライアンスから逸脱したり、セキュリティリスクが発生したりする事態を迅速に判断することもできます。 迅速に対応して開発者と協力して問題を修正し、最善のセキュリティプラクティスについての早急なフィードバックを提供し、以後のプロセスを改善することができます。

“やるか、やらないかじゃ。試しはない ” – ヨーダ

DevSecOpsのアプローチを実装するのは、難しい作業のように思えるかもしれません。また成功するためには、組織内のセキュリティの考え方を変えるなど、多くの課題があります。 それ自体は、ジェダイの精神的なトリックを使うべきだと思えるかもしれません。しかし、あなたはプロセスにコミットし、その後に自分の間違いから学び、また過去に同じことをした他の人から学ぶ必要があります。DevOpsと同様に、DevSecOpsは反復学習と改善のプロセスでなければなりません。 DevSecOpsは、迅速なフィードバックを提供するためにセキュリティプロセスを自動化するための適切なツールを選択することでもあります。PagerDutyを活用すれば、そのトランスフォーメーションを助けられると思います。

あなたの組織でDevSecOpsをうまく実装する方法の詳細を知りたいですか? Datadogの導入事例をチェックしてください。

本記事は米国PagerDuty社のサイトで公開されているものを日本語訳したものです。原文はこちらです。

2018年2月20日  (更新日:2022年3月9日)    |    ベストプラクティス

デジタル経済の世界で顧客サポートがより良いサービスを提供できる5つの方法

顧客サポートチーム はあなたの組織の顔です。顧客と最も関わるグループであり、顧客のロイヤリティ を形成する上で重要な役割を果たします。顧客サポートを 適正にしましょう。これは、既存の顧客に製品を簡単にアップセルおよびクロスセルしたり、将来のバージョンの製品に対応するためのアイデアを提供する方法になります。 顧客サポートはさらに、他のチームを一つにし、誰もが顧客に集中し続けるようにするチームでもあります。

顧客サポートの重要性を意識して、日々の仕事を行うときにサポートチームが最高の経験を確実に得られるように配慮することが重要です。 それが今日、話すことです。

  1. サポート・アプリケーションを1ボードに統合する

サポートチームは通常、それぞれ異なるタスクに特化した複数のアプリケーションを使っています。 サービス管理にはServiceNow 、問題追跡にはJira、コミュニケーションにはSlack、 インシデント対応と解決のためのPagerDuty、その他にもモニタリング、 顧客とのコミュニケーション 、レポート作成などのツールを使用できます。 担当者がこれらのアプリを切り替え続けるのにうんざりするようになることがあります。 さらに悪いことに、これらのアプリで矛盾する情報が表示されると優れた顧客サービスを提供することが困難になることがあります 。

もっと良いアプローチは、これらのアプリを統合して、担当者がログインしているアプリに関係なく統一された形で操作できるようにすることです。 サポートチームによって使われる主なアプリのほとんどは、 他のトップツールと統合するためのAPIと統合ガイドを提供しています。 ソリューション全体を統合する能力は、顧客がソリューションを選択する際の重要な差別化要因となっています。

これらのアプリケーションを統合することで、サポートチームは、Slack内からPagerDutyインシデントを作成し、Jiraを使用してエンジニアリングチームにフォローアップを求めて問題を解決させることができます。 そこから、ステータスをServiceNowに同期させることができます。 サポートチームは、電子メールやソーシャルメディアなどの任意の優先メディアを介して顧客とやり取りすることができます。 すべてこれがシームレスになり、サポートスタッフの仕事が楽になります。

  1. ダッシュボードを使って応答時間を短縮する

「重要度の低い指標」(バニティ・メトリクス)はサポートチームの悩みです。担当者が1日に何枚のチケットをクローズするかを基に評価された時代は過ぎました。 今日のメトリクスは、担当者中心ではなく顧客中心です。 MTTR(平均回復時間。mean-time-to-resolution)のような指標のほうが、単に顧客に対応した回数より重要です。

これらのメトリックをダッシュ​​ボードに表示すると、チームは適切な方向へ進んでいるときには元気付けてくれますし、状況があまりうまくいかないときには警告してくれることになります。 緑色、黄色、赤色などのカラーコードを使用して、トップレベルの指標や個々のインシデントのステータスを表示することで、即応性を高めるのに役立ちます。 PagerDutyやServiceNowなどの先進的なツールでは、ダッシュボードとビジュアライゼーションが事前に設定されています。そうしたツールに必要なのはデータを入力することだけで、それも柔軟かつセルフサービス的な方法で、簡単かつ迅速に行えます。

  1. マルチタッチサポートでSLAを維持する

顧客は複数のデバイスと通信チャネルを使っており、チャネルの多くにあなたもいてくれることを望みます。電子メールだけでなく、ライブチャット、電話のホットライン、製品フォーラム、さらにはソーシャルメディアの会話が、サポートの会話が行われる場所です。これらのすべての会話をサポートツールに統合し、効率的に管理できる必要があります。

これを行う1つの方法は、チャネル間の通信が統合されていることを確認することです。 たとえば、 Live Call Routingを使い、電話をかけてすぐにインシデントを報告できるようにし、誰でもすぐに適切な対応者に連絡できるようにすることで、インシデントを迅速に受信したり解決したりできるようになります。

マルチタッチサポートの最大の利点は、異なる顧客に異なるSLAを設定できることです。 たとえば、プレミアム顧客のみがサポートのための24時間×7日専用でつながる内線番号を取得し、他の顧客はフリーダイヤル番号にアクセスさせるようにできます。 このようにして、すべての顧客に対して差別化を進め、すべての顧客が自分が選んだサービスレベルに満足していることを確認することができます。

  1. インテリジェンスによるカスタマエクスペリエンスの管理

顧客があなたに連絡するために使えるチャネルの数が多いと、問いあわせの洪水を起こす可能性があるので、その数は顧客サポートチームの目標ではありません。 理想的には、着信チケットの数を減らし、インシデントを減らし、顧客サポートへ連絡することを顧客にとっての最後の手段にしたいと考えます。 これは、顧客が体験することを事前に計画するのに役立ちます。 セルフサービスモデルは、ほとんどの組織が好むものです。 しかし、これには最新の知識ベースやドキュメンテーション、活発なフォーラム、製品の関係する場所での小技やヒントが必要です。長期的な努力を必要とするので時間がかかります。

顧客体験の管理を始める最善の方法は、顧客が即時対応を期待できる自動化ルールを設定することです。 たとえば、最優先のインシデントには24×7でつながる電話番号が必須です。 他のインシデントは4時間のターンアラウンドタイム(TAT)がかかる可能性があるとしておきます。 同様に、インシデントがキューにヒットしたら、チーム内でどうルーティングするかを決めるための自動化ルールを設定できます。PagerDutyは、スケジュールの設定とエスカレーションの自動化に優れています。これにより、チームがバーンアウトを起こさずに優れたサービスを顧客に提供できます。

  1. 継続的改善のためにCSATを測定する

顧客サポートの有効性を追跡することが重要です。 そのためには問題が終了した直後にユーザーに、サポートのレベルに満足したかどうかを尋ねる必要があります。 CSAT(顧客満足度)を測定すると、時間の経過とともに改善状況を追跡するためのベンチマークが得られます。 上記の提案をすべて実行することで、CSATが正しい方向に推移するのが見えるはずです。

顧客サポートは、あなたの製品や組織について顧客がする経験にとって本質的に重要なものです。 ワールドクラスの顧客サービスを提供するためには、サポートチームは仕事に最良のツールが必要です。 しかし、それは終わりではありません。これらのツールをシームレスに統合し、独自の機能を使ってサポートプロセスをより簡単に、より速く、より効果的にする必要があります。 PagerDutyのようなプラットフォームは、このレベルのカスタマーサポートを可能にしています。

顧客サポートチームがインシデント管理によりオペレーションを最適化する方法の詳細を知りたい場合は、当社のeBookをご覧ください。(訳注:eBookは英文です。)

本記事は米国PagerDuty社のサイトで公開されているブログをそのまま日本語に翻訳したものです。原文はこちらを参照してください。

2018年3月21日  (更新日:2022年3月9日)    |    ベストプラクティス

インクルーシブなコミュニティを育成する3つの方法 from Jennifer Tejada

「魚は頭から腐る」という言葉を知っていますか?それは、失敗の責任が組織の最上位にあることを意味します。企業が不安定になるのは、リーダーシップに責任があります。逆に、成功する文化は企業のリーダーの管理下にあります。その基調はトップにあります。その文化が定義されるのは、人が受け入れたいと思う最も低いレベルの行動で定義されます。指導者として、私たちは目標とBHAG(big, hairy, audacious goals:大きく、扱いにくい、大胆な目標)のことだけでなく、組織のテンポ、許容度、限界を決定します。高みに向かう私たちの旅で、妥協したくないことは何ですか?私たちが構築するだけでなく、保護すべき価値観や原則は何ですか?真の成功は、あなたが創造する価値と創造する方法の両方によって特徴付けられます。複数の人々が関わっているときは、人々はいつも関わっているものですが、全てを賭けて勝つという選択はありません。

高成長中のクラウド企業のリーダーとして、私は勝利のことを簡単に考えています。ユーザーが勝利したら、私たちも勝ちます。当社の唯一の「ヒーロー文化」は、ユーザーや顧客を大成功に導こうとみんなで動くことであり、利害関係者の目に見えるヒーローであることです。

ダイナミックで高速で競争の激しい市場でお客様に革新を起こすには、PagerDutyでキャリアを積む間に最高の仕事をする人材が必要です。私たちの人とチームが繁栄するためには、明白な目標を設定し、価値をー英語そのままの意味でー人に示せるようなふるまいとして定義することが必要です。私たちは、受容できない行動を呼び出すこと、その受容できない行動を安全な方法でレポートするのはOKなのだと知らせる道を、歩かなければなりません。これは難しいことです。そして努力も必要です。暇があるとき簡単にできることではなく、組織全体とコミュニティ全体を一続きにする必要があります。私たちが歩いた道の一つは、性別に関わらず平等な賃金を保証するための体系的な変更を実施したことです。それは昨年のことでしたが今後も続けます。PagerDutyでは、男性と女性のチームメンバーは、仕事により1〜2%の範囲内で、均等に報酬を受けています。

私たちは私たちのインクルーシブな企業文化を非常に誇りに思っています。それは当初から、私たちのビジネスの中心的な教義と資産となってきました。 最高経営責任者(CEO)として、私と私たちのリーダーシップチームは、全力で私たちの価値を実証する過程では、思慮深く、意識的に、そして目に見えることが重要だと分かっています。 我々の価値観は、ポスターに書いた言葉以上のものであり、一緒に勝つ方法、コミュニティの倫理、完全性、平等、インスピレーションのタペストリーのファブリックを定義しています。

Community。 PagerDutyはすべての人のためのものです。 Trust。 私たちを信頼じても大丈夫です。私たちができると言ったことは絶対成功させます。 Growth。 私たちはユーザーと顧客のために、私たち自身の個人的な発展のために、そしてビジネスの中で、不屈の精神と立ち直る力と集中をもって、成長するために努力しています。 Passion。 私たちは一体です。あなたがしていること、それをしてあげている誰かを愛することに喜びがあります。 Team。 私たちは一つの多様性のあるチーム(ONE DIVERSE TEAM)です。 我々は一緒に勝ち、失敗し、一緒に学びます。

私たちは、他の企業やチームが、私たちの学びを活用して、自分たちのチームの中でのインクルージョンを促すことを期待をして、3つのイニシアチブを共有しています。

  1. 財団の設立:新しい従業員リソースグループとリーダーシップ開発

従業員リソースグループ(ERG:Employee Resource Groups)は、組織の使命、価値観、目標に合わせた多様で包括的な職場文化を育成する、自発的で従業員主導のグループに資金提供しています。私たちは最近、PagerDutyで次の5つのERGを立ち上げました。

SisterDuty。女性のための包括的な文化と専門の開発の機会を促進する。 RainbowDuty。性別または性的志向にかかわらず、すべての従業員にとって積極的で協力的で包括的な環境を促進すること。 PatriotDuty。募集、社内教育、地域社会への取り組みを通じた軍事的支援とプレゼンスを促進し構築すること。 Migrant Duty。理由にかかわらず、生まれた国では働いていない海外からの従業員をサポートする。 Array。多様で包括的なグローバルな職場環境を整え、奨励することにより、黒人/ラテン系の従業員のための働く場を当たり前のものにすること。

これらのグループは、ワークフォースの中でも伝統的に少数派の従業員を受け入れ、職場のネットワーク、擁護者、そしてメンターの支援を組織化して提供します。ロールアウトして以来PagerDutyの草の根組織であるERGは、すでにさまざまなメンター・ネットワークを作り、Pride Week(プライド・ウィーク)の間にお祝いのブランチを開催するなど、素晴らしい仕事をしています。

さらに、当社の疲れを知らないマネージャーたちは、すべての従業員が限界まで激しく働けて、繁栄し、成長し、変革することができる適切な作業環境を構築するために非常に集中しています。次世代の業界リーダーを育成し準備することは、私たちの責任だと考えています。そのため、彼らに世界の変化のペースについていけるだけの基礎的なリーダーシップスキルと知識を身につけさせなければなりません。

さらにチームを成功に導くため、新しいリーダーシップ、マネージャー、インタビュアートレーニングプログラムを開始し、差異の受け入れと活用に特化したモジュールを追加しました。また、日々の管理やインタビューの過程での多様性やインクルージョンに関する具体的な行動項目を設定しました。

2.多様性を人材募集の優先事項とする

昨年(訳注:2017年)だけでも、当社はオーストラリアと英国にオフィスを開設し、ワークフォースも大幅な成長を見ました。PagerDutyは、Inc 500によって最も成長が著しい会社に選ばれ、2016年と2017年の両方でForbes Cloud 100とDeloitte Fast 500リストに追加されました。

高度な成長は驚異的な才能の必要性をさらに増幅します。新しい人を連れてくる際には多様性に焦点を当てなければ、針を動かすことはできません。だから私たちは自分のバージョンのNFL ルーニー・ルール(Rooney Rule) を公​​開しました。仕事が投稿された瞬間から多様なパイプラインを提供することに重点を置いています。 最終回のインタビューで不十分な人口からの候補者を見たことがない場合は、単にオファーを延長しません。

(訳注:ルーニー・ルールとは、「NFLのチームのヘッドコーチやゼネラルマネジャーを募集する際には、最低1名はマイノリティグループ(黒人若しくは少数派民族等)の候補者を面接しなければならない」というルールのこと。これを考案(制定は2003年)したピッツバーグ・スティーラーズ会長で、リーグのダイバーシティ委員会議長だったダン・ルーニー氏の名にちなむ。)

私たちはまた、インターンシッププログラムで独自のアプローチを取ってきました。大学キャンパス採用プログラムとの素晴らしいパートナーシップに加えて、私たちは複数のパートナーシップとハッカソンを活用して、少数派の人に手を差し伸べることに重点を置いています。自分たちの努力のおかげで、私たちのエンジニアリングチームは過去12ヶ月間にインターンの数を3倍にできたことには私も感動しました。昨年開催したインターンシップのクラスは、50%の女性/黒人/ラテン系の人で構成されていました。今夏は、Code2040から最初の仲間たちを迎えつつあり、新鮮で多様な才能を私たちの早期キャリアプログラムに迎えるさまざまな方法を引き続き検討する予定です。

  1. BabyDuty:新しい親をサポートする、業界をリードする育児休業ポリシー

米国の親は、仕事と家族のバランスを取ることになると、苦しい戦いに直面します。 米国では、育児問題に結びついた生産性の低下や欠勤により、ビジネス界は 毎年44億ドルの損失を抱えています。 経済協力開発機構(OECD) によると、米国は有給育児休暇を国で義務付けていないことで、41カ国の先進国の中で最下位のランクとなっています。 国として、私たちは子育てをする親達のキャリアの成長を可能にする必要があります。

PagerDutyは、この重要な動きを支えるために私たちの資金を投入することを優先するようにしました。 当社の新しい育児休暇に関するポリシーは、業界で最も寛大なものの1つです。業界平均の13-14週間と比較して、当社では米国の有給父母休暇手当を雇用保証付きで22週間に設定しています。養子縁組の親を含む、妊娠していない親に対して12週間の有給育児休暇を提供します。 私たちは、BabyDutyのチームメンバー全員が、育児に必要な休暇をを取り新しい子供と過ごすことが可能になったことを非常に誇りに思っています。

最近のマッキンゼーの調査によると、「人種や民族の多様性に関して上位4分の1にある企業は、財務収益率で各国の業界中央値を上回る確率が35%」とされています。PagerDutyでは、初期から多様で包括的な企業文化を実践しています。 チームに力を与え、企業文化を強化し、具体的なビジネス成果を生み出す方法を直接見てきました。 CEOとして、私は活気のある企業文化のこの主要な柱となる部分に個人的に献身しており、これを次のレベルに上げるために引き続き取り組むことを楽しみにしています。

さらなる背景については、国際女性の日のために私たちのチームに送った私のメッセージをご覧ください。 ハッピー・ウィメンズ・デイと、私の家とも言えるこの素敵な会社(PagerDuty)をリードするため最高のバージョンの私を見つけてくれた素晴らしい女性と男性たち(あなたたちは誰かわかっていると思います)に感謝します。

ハッピーインターナショナル・ウィメンズ・デイ! 今夜私は仕事から少し遅れて帰ってきました。私たちの12歳のサマンサと私はキッチンに一緒に立っていて、夫が親切にも買ってきてくれたテイクアウトのフォーを食べていました。私たちはミシガン州に住む甥に午前12時に誕生日のお祝いのメッセージを送り、明日のプレー・プラクティスのためにカープールを予約していないことに気付きました。月曜日までに英国のプロジェクトがあります。これは明らかに珍しいアートのサプライが必要でしたし、出張旅行のために私が欠席する学生主導の会議を再スケジュールするためにサムの教師に電子メールを送る必要があります。私の夫はオーストラリアのクライアントとの電話会議で2階にいました。サムはすっかり心得ていました。彼女はGoogleの International Women’s Day doodle (国際女性デーのドーダリー) のほうに興味を持っていました(クール、でしょう?)。

Norman Rockwellの家族の夕食の肖像画そのままというわけではありません。しかし、それは私たちの “普通の”ことです。私たちは何年もの間、私たちのクレージーなスケジュールに適応して、こんな風に夕食を「一緒に」食べて、同じ町の中に一緒にいるこういう単純な瞬間の連続をかけがえないものだと分かっています。私は仕事が大好きで、個人の人生も大好きで、ある時はこんな風に同じ日に両方を全てうまくこなせるのです。

夕食のあいだ、サムと私はまた、International Women’s Dayを祝うための計画について話し合いました。その日私は紫色のドレスを着て、彼女は髪に紫色のシュシュを着けることにしました。ドーナツも持っていきます。サムは学校で「米国の女性は平均で男性より1ドルあたり17セント給料が安い」という新しい情報を学びました。でも私は彼女にPagerDutyではそうでないことを伝えられて誇りに思っています。job-for-jobに、私たちは昨年1〜2%の範囲内のジェンダー・エクイティを達成しました。

彼女はパリティを達成するために一所懸命働かなければならないことを「狂った町」だと考えています。これは私に希望と喜びをもたらします。彼女と次世代の起業家と指導者が今日出現した行動主義と対話から学び、より包括的で公平な文化、企業、チームを設計することを願っています。実用主義的で、オープンマインド、そして好奇心の強い十代の若者時代を通して、効果的に先に進む機会を半分得ている自己実現性の高い若い女性に育っていることを知るのは嬉しいことです。彼女は、私たちが今日経験しているよりもさらに、職場において平等が進む機会に会えるでしょう。

2018年国際女性デーのテーマは、 #PressforProgressです。PressforProgressは、賃金の平等のような測定可能な進歩に重点を置いて、すべての人々の平等と社会正義をサポートするために、女性の同僚、チームメート、友人や家族に寄り添う行動をしようという呼びかけです。ジェンダーによるペイ・ギャップをなくすことはよい起点ですし、私たちはPagerDutyの進歩を祝うべきだと考えます。私たちは業界を実例でリードしているのです。私たちは、リーダーシップの役割を担ってジェンダー・エクイティに向かって進んでおり、最近は、エンジニアリングのリーダーシップでジェンダーバランスを達成しています。そして表面に現れない少数派のインクルージョンを進めダイバーシティのゴールに向かって進んでいます。私たちがやるべき仕事はもっとたくさんあります。

ハイテク産業と米国は、バランスのとれた平等を達成するために、他の産業や国の後塵を拝している恥ずべき存在です。我々が良いもののために革新し、現状を打破し、世界を変えたい場合、より多くの進歩を早める必要があります。私は個人的にこの挑戦の端緒を作ると約束しており、私はあなたの助けが必要です。私は頻繁に「どうすることができますか」、あるいは「どのように助けてくれるのですか?」と尋ねられます。私の好きな提案は次のとおりです。

あなたのようではない人に、職場で目標を達成するためにできることを尋ねてください。対話を開始して聞いてください。#empathy 当社の社内外で女性または少数派の人を後援すること。これは、あなたのネットワークへの紹介をしたり、誰かをオープンな役割、昇進、または賞賛のために推薦する機会(話し合い、ネットワーキングイベント、名高いプロジェクト)に招待するなどの単純なことでできます。 部署やチーム、プロジェクトにバランスをとる機会がある場合は、掛け声をかけて他の人を招待してください。計画を立て、次の会議に先立って不公平に対処してください。 他者を助け、包括的な行動を奨励し、実証し、部署の声をシェアして、声なき人の声を増幅したり励ましたりすること。 善意を持とうとすること。私たちは不完全な人間です。私たちは間違いを犯すでしょう。私たちは一緒に強くなれます。あなたに似ていない人と単独で会うことを恐れないでください。恐れは軽視を生みます。

団結を示すために紫色を着用する 紫色のリボンのSlack emoji (:iwd:) を使用してください #PressforProcess selfieカードで画像を撮り、#sisterdutyチャンネルに投稿してください

サンフランシスコとトロントのオフィスでイベントを企画してくれたSisterDutyに感謝します。 Discussion Panel at 9 am PT / 12 pm ET featuring four local women professionals

Roula Vrsic – Agreement ExpressのCMO Cinzia Bazzo – SalesforceのStrategic Account Executive, Canada Enterprise Cheri Mara – Indigo Booksのデジタルマーチャンダイジング担当VP Kelly Festarini – Procter & GambleのCustomer Business Development New Hire Capability and Recruiting担当

#YouToo: Feminism, Activism, and Allyship at 12:15 pm PT / 3:15 pm ET 当社のRenee Lungは、肯定的な変化の一部となる方法と、#metooが何を意味し、それを#youtooに変更することは何を意味するかを話します。 最後に、地域社会の女性を支援するスポンサー、同盟者、そしてメンターに感謝します。 ハッピーレディースデイ! Jenn

本記事は米国PagerDuty社のサイトで公開されているブログをそのまま日本語に翻訳したものです。原文はこちらを参照してください。

2018年8月1日  (更新日:2022年3月9日)    |    インテグレーション&ガイド

Crashlyticsインテグレーションガイドを追加しました

Crashlyticsは軽量ながら非常に強力なクラッシュレポートソリューションです。 CrashlyticsとPagerDutyをインテグレーションすることで、アプリケーションのクラッシュレポートに関するリアルタイムのアラートを受け取ることができます。

詳しくはこちら

2019年1月24日  (更新日:2022年3月9日)    |    ベストプラクティス

オペレーションの未熟さがコストを増大させる

Aditya Patil

January 3, 2019

デジタル運用の成熟度とは?

デジタル運用の成熟度は、リアルタイムの作業での組織の有効性と、その組織がインシデントへの対応に熟達するにつれて改善するパフォーマンス指標にフォーカスする能力として、定義されます。

PagerDutyは、複数の業界に渡る600名以上の回答者を対象にした調査を含む、広範囲な調査と9年間の業界のデータに基づいて、次の4つの運用成熟度レベルを特定するモデルを開発しました。

リアクティブな組織は、ほとんどの問題を顧客が報告したときに見つけることが多く、これらの問題に対処するためのプロセスを持っていません。第1線にいるレスポンダーが、サービスの問題を解決するためのスキル、知識、または権限を持っていないこともよくあります。 レスポンシブな組織は、顧客に影響が出る前にいくつかの問題に直面します。第一線のレスポンダーはスキルを持っていて問題を防ぐための権限を得始めています。しかし、その人々はまだ自分たちの仕事をするのに必要な情報を欠いています。 プロアクティブな組織は、顧客が影響を受けたり気付いたりする前に、ほとんどの問題をあぶり出して解決します。過去の問題から学んだことは自動的に文書化され、レスポンダーは現在の問題を解決し将来の問題を防ぐための知識と権限を与えられています。 プリベンティーティブな組織は、顧客に影響が及ぶ前に、ほとんどすべての問題をあぶり出して解決します。このレベルを達成するのは非常に困難であり、このレベルで活動している組織の特徴は継続的に学習する文化を持っていることです。この組織のレスポンダーは、現在の問題を解決し将来の問題を防ぐための知識と権限を十分に与えられています。これらの組織は、リアルタイムの対応プロセス全体にわたって自動化の仕組みを多用しています。

PagerDutyは、以下の図に示すように、組織の運用上の成熟度を決定する上で重要な5つの重点分野を特定しました。

5つの重点分野がビジネスの改善にどのように役立つかについて、さらに詳しく説明しましょう。

1.カスタマーエクスペリエンスを改善する

ビジネスを常に「顧客第一」と考えるように位置付けることは、今日の市場では重要です。これは、顧客にシームレスで中断のない経験を提供するために可能な限りのことを行うことを意味します。次のシナリオを検討してください。

あなたはサンフランシスコのサウス・オブ・マーケット地区にあるお気に入りのPhilz Coffeeに来て、ブリトーを欲しがっています。あなたは自分のスマホでライドシェア用のアプリAを開きますが、それがロードされません。それであなたは数秒待ちます。いや、まだロードされません。ついにあなたはあきらめてアプリを閉じて、競合他社のアプリBを開きます。これでは、Aの売り上げを失ったことになりますね。それだけじゃありません。

次回乗車が必要になったときには、前回のライドシェア会社Aでの体験を覚えている可能性があるので、まずB社のアプリを開きます。つまりそうした1つのちょっとした体験がA社の評判を損ない、将来的に売り上げをフイにさせる可能性があります。実際、Gartnerは、平均的な企業のダウンタイムコストは1分あたり5,600ドル、または1時間あたり約300,000ドルであると見積もっています。

潜在的なお金を失う可能性は大きいのです。顧客と収益を維持するために、企業は自社のデジタルビジネスがほぼ100%常に稼働している状態を確保する必要があります。しかし、当社の調査によると、回答者の50%以上が自社の組織がレスポンシブまたはリアクティブであり、顧客に損失を与え顧客との関係を壊すことにつながるダウンタイムを防止または削減するための適切な対策を講じていないことを示しています。

  1. 従業員の健康と会社の文化を改善する

最も単純に言えば、企業は共通の目標に向かって努力する人間の集団に他なりません。 (そしてPagerDutyには最高の人間がいます。一緒にやりましょう!)

従業員は会社の最も貴重な資産でもあるので、燃え尽きを防ぐための対策を講じることはその人たちの幸せと生産性を維持するために不可欠で、結果的に離職率も低くなります。

なぜ組織が離職率を気にする必要があるのでしょう?貴重な蓄積された組織知を失うことは置いておいて、IT専門家に関するPagerDutyの最新の調査では、1人の経験を積んだレスポンダーを別の人に変えるには最大30万ドルものコストがかかることが分かりました。こうした種類の数字を検討すると、次のような質問をすることによって個人と全社の健康状態を追跡することが会社にとって最も重要です。

勤務時間後に従業員が呼ばれる頻度はどのくらいですか? あなたのチームのIT担当者の年間離職率はどのくらいですか?

これらの指標にアクセスできることは有益で、対処不可能なアラートや繰り返し発生する対処不可能な量のインシデントが、仕事から離れた従業員をイライラさせることにつながることを理解できるようになります。また、アラートの数を減らすことによる影響はすぐには表に出ないものの、時間の経過とともに大きな違いが生じることも当社のデータから明らかになっています。

現実に、アラートを減らすための対策を講じた成熟した組織では、成熟していない同業者と比較して、オンコールする担当者(レスポンダー)の離職率が21%低くなっています。 50人のレスポンダーがいて、10%の離職率である会社の場合は、21%の削減は年間31万5000ドルの節約になります。

  1. MTTRを削減するために各プロセスを最適化する

プロセスの最適化は組織がスケールするにつれて重要になります。しかし、それは単にベストプラクティスを見つけてそれに従えばよいというわけではありません。つまり、各企業は改善のための領域を特定するために既存のプロセスを評価する必要もあるのです。 例えば、インシデント対応中の利害関係者への通知は、ほとんどの組織で改善できるプロセスです。以前のブログで説明したように、中核の対応チームの外にいる人々に最新情報を提供するためのコミュニケーション戦略を構築することで、オンコールレスポンダーはインシデントの解決にもっと時間を費やすことができます。

さらに、インシデント対応プロセスは、インシデントが解決されたというだけでは完了しません。成熟した企業におけるデジタルオペレーションの要素には、チームが根本原因の分析を実行できるようにする、ブレームレスつまり個人の責任を問わない事後分析(ポストモーティム)プロセスが含まれます。これはパターンを解析し、類似のインシデントが再発するのを防ぐのに役立つ洞察を提供します。

  1. 知識共有の実践を育てる

  2. 正しい技術とツールを使う重要性

現代では組織がビジネスプロセスを最適化するのを支援するために豊富な技術とツールが利用できます。そして健全で成熟したデジタル運用のプラクティスを構築する場合でも同じです。オンコール中の従業員は、大量の通知や対処できない警告に溺れてはいけません。以下の表は、組織の成熟度に3つの重要な指標がどう対応しているかということに関するいくつかの重要な発見をまとめたものです。

注目すべき点は:

最も成熟した回答者は25%のアラートしか 対応不能(unactionable)なものはないと回答していますが、最も成熟していない回答者は28%のアラートがunactionableだったと回答しています。 最も成熟した回答者のインシデント対アラート比(incident-to-alert ratio。実際にインシデントになったアラートと全アラートの比 )は約1:3でしたが、最も成熟していない回答者は約1:1でした。 最も成熟した回答者は自動化で問題の57%を解決しました**が、最も成熟していない回答者は自動化で問題の16%しか解決できませんでした。

成熟した組織によくある最も一般的な特徴は、過去のインシデントから学んで、それによって、顧客が影響を受けるようになる前にインシデントを解決する、またはアラートのノイズを減らす、どちらかのテクノロジーを利用していることです。 従業員が対応不能なアラートの確認と自動化で解決される可能性のあるインシデントの手動での解決に注力している場合は、て本来は業務の革新や他の問題解決にかけるべき数えられないほどの人・時が失われます。重要なのは、組織のデジタル 運用をReactiveからPreventativeに成長させ、そしてカスタマーエクスペリエンスを向上させるための革新の推進に集中するために、チームに適したツールを見つけることです。

組織の運用上の成熟度を向上させる方法についてもっと知りたい場合は、弊社までぜひお問い合わせください。

GET STARTED

この記事は、PagerDutyサイトに掲載されたブログをDigitalStacksが和訳・追記したものです。無断複製を禁じます。原文はこちらにあります。

2018年3月12日  (更新日:2022年3月9日)    |    インテグレーション&ガイド

HashiCorp Consulインテグレーションガイドを追加しました

HashiCorp Consulは、インフラ内にあるサービスを検出および設定できるようにするサービスで、高可用性をもたらす分散型システムを構築するために利用できるサービスです。複数のデータセンターに分散するシステムを構築・管理できます。

詳しくはこちら

<  123456789101112  >