以下の内容はhttps://agnozingdays.hatenablog.com/entry/2019/02/13/235606より取得しました。


PagerDutyのPostmortem(トラブル事後分析)ガイドが公開。かなり良さそう。

Monitoring Weekly - Improve your application monitoringのニュースレター経由で知ったのだけど、PagerDutyからPostmortemのガイドが公開されていたようだ。

ざっと読んでみたところ、かなり有用そう。

Postmortemとは

訳書だとSRE本やEffective DevOpsなどが詳しかったと記憶しているが、定義はこんな感じ。

ポストモーテムは、インシデントとそのインパクト、その緩和や解消のために行われたアクション、根本原因(群)、インシデントの再発を避けるためのフォローアップのアクションを記録するために書かれるものです。
SRE 15 章 ポストモーテムの文化:失敗からの学び

未訳だけれどもSRE本の続編、SRE Workbookに書かれたPostmortemの話は以下の記事で触れているので興味があればご一読いただきたい。
agnozingdays.hatenablog.com

PagerDutyのPostmortemガイド

PagerDuty Postmortem Documentation
というわけで、ざっと読んでみた感想。

  • ChromeGoogle翻訳機能でもけっこう読める(ただし、Postmortemが「死後」と翻訳されるため、かなりスピリチュアルな翻訳になるので注意)
  • 「学習する文化」といった背景の話から初めて、ステップバイステップの執筆ガイド、共有方法までカバーされていて、たぶんいきなりトライすることができそう
  • テンプレートだけでなく、チェックリストなども含まれていて至れり尽くせり
  • Apache Licenceなので使い易そう
  • 参考資料集が充実していて興味深い。紹介されていた以下の本はぜひ読んでみたいが・・・(どちらもSafariBooksOnlineに収録はされているようだ)


SREやDevOpsを採用(?)していなかったとしても、品質改善活動の一環として「トラブル報告」「原因分析」「再発防止」などの活動をしているのであれば、いろいろと改善のためのアイデアが見つかりそうだ。




以上の内容はhttps://agnozingdays.hatenablog.com/entry/2019/02/13/235606より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14