keyboard_double_arrow_up

Blog X-Tech5エンジニアがお送りするテックブログ
SREやDevOpsをはじめ、インフラエンジニアリングの実践情報を届けします。

[SRE]定点観測会の事前準備とは?

2024年6月4日 

このBlogは、2024年3月26日(火)に開催されたSHIFT主催のオンラインイベント 『 No SRE,No life|教科書には載っていない!俺たちが考えたSRE推進の道しるべ 』https://techplay.jp/event/934843)にて、参加者から頂いたご質問を書き起こしたものです。

動画アーカイブは以下をご参照ください。動画内1:11:42以降の箇所を書き起こしています。

ご質問

定点観測を行う際に準備を行うということでしたが、具体的にどのような準備をするのですか?

回答

オブザーバビリティツール、issue、チケット、イベントカレンダーなどを下調べをして、話題振りができるように事前にレポートを書いておくことが多いです。(補足:この際、レポートは事前に参加者に共有しておくことが望ましいです)

内容としては、レイテンシーの変動やエラーの発生など、ユーザーに影響になりそうなポイントをピックアップして、実際にどうでしたかと、それは結局その出来事があったタイミングに例えば事業側としては「そういえばこんなことがあった」とか、サポート側から「こんな問い合わせが来てた」みたいなことがその場で割と出ることが多いので、それをもとに会話することが多いです。

あとはメトリクスやログの異常変動、イベントの影響やインシデントの振り返りも行います。

この際、メトリクスの傾向が変わったことを深追いしすぎてしまうことが多いのですが、それは控えて、ユーザーや事業にどういう影響があったかを観点にすることが多いです。

また、ユーザーや事業の観点でいうと、コスト(クラウド利用料等)の状況がどう変わっているかを取り上げたりもします。

網羅しようとするとどうしてもこなす感じになりやすく良くないので、網羅することにあまり重点を置かずに、実践的なものだけをやっていくように準備することが良いと思います。

イベント概要

  • 日程:2024年3月26日(火)19:00〜20:35
  • タイトル:No SRE,No life|教科書には載っていない!俺たちが考えたSRE推進の道しるべ| #SHIFT TECH TALKS#1
  • ハッシュタグ: #SHIFT_SRE
  • イベント詳細:https://techplay.jp/event/934843

登壇者に直接話を聞きたい・お困りごとを相談したい方はこちら!

SREサービスから無料相談会をお申し込みください!

SREサービス – SRE を実現するエンジニアリングサービス