OBServe事例)SRE/オブザーバビリティよろず相談:SREを始めるにあたりまずSLI/SLOを決めたいのですが、なかなか決まりません
SREやオブザーバビリティについて、X-Tech5に寄せられたご相談事例を紹介します。
目次
相談者
- 大手SIerのエンジニアさん
- 運用中のシステムにDevOps・SRE・オブザーバビリティをとりいれていく機運になっている
ご相談内容
SREに取り組んでいく方針になりました。ゴールを設定して計画的に進めていくために、まずは設計段階としてSLIと、できればSLOを定めようと思います。
しかしこのSLIとSLOがなかなか決まらず、設計フェーズから実装フェーズに進められません。
どうしたらスムーズにSLIとSLOが決まりますか?
ご回答
発想を転換したいポイントが3つあります。
まずは進め方です。ウォーターフォール方式の進め方が念頭にあるように見えますが、ウォーターフォール方式の進め方は不適切です。根本的なところで、SREは(すくなくともこのシステム・今のあなたたちにとって)探索的な取り組みですし、経験もデータもない状態ですからどれだけ時間をかけても、計画も設計も精度が高くなりようがありません。探索的な取り組みは仮説検証型の進め方が向いているのでやりかたを変えましょう。キーワードは”アジャイル”や”OODAループ”です。
次にSLIやSLOの指標としての性質です。一般的なビジネス指標と同じく、SLIやSLOは受動的になにかから導かれて決定論的に”決まる”のではなく、相応の意志をもって能動的に”決める”ものという側面があります。なにがSLI/SLOに相応しいか判断するのではなく、なにをSLI/SLOにするか意思決定するのです。適切な意思決定のために知見やデータは重要ですから、知見やデータをないがしろにはできませんが、決めなければいけないときに”データがないから決められない”は意思決定としてナシでしょう。データがないのに決めなければならないのであれば、見直し方法やタイミングを含めてデータがないなりに決めて進めていくものです。
最後にSLI/SLOありきで考えているところです。前項で「決めなければならないときに」と言いましたが、いまは本当に決めなければならないときでしょうか?SLIやSLOがない状態でもSREを始めることはできます。SLI/SLOを軸にすべてを考えて決めていく世界観はシンプルで美しいのですが、だからといってSLI/SLOがSREのすべてではありません。サービス運用にとって時間がもっとも貴重なリソースですから、SLI/SLO決めで紛糾して歩みが止まるのはもったいないです。もしSREの取り組みを進めるにあたりどうしても”なんらかの指標による導入効果の測定”が必要であれば、Four Keysを利用する手もあります。
SLI/SLOは適宜見直すべきものですから、わたしはまず最初はFour Keysを参考指標にすることをお勧めしています。
参照:オブザーバビリティ用語集 – Glossary of Observability Terms
この他のarticleOBServe事例)SRE/オブザーバビリティよろず相談シリーズはこちら