keyboard_double_arrow_up

Blog X-Tech5エンジニアがお送りするテックブログ
SREやDevOpsをはじめ、インフラエンジニアリングの実践情報を届けします。

OBServe事例)SRE/オブザーバビリティよろず相談:SLIとSLOを定めたらSLAもそれに従うべきでは?

2023年8月31日 

SREやオブザーバビリティについて、X-Tech5に寄せられたご相談事例を紹介します。

相談者

  • 大手SIerのエンジニアさん
  • 運用中のシステムにDevOps・SRE・オブザーバビリティをとりいれていく機運になっている

ご相談内容

このシステムにはもともとSLAが設定されていますが、根拠や制約は正直なところ今となってはよくわかりません。 SLIを見定めSLOを設定し運用していくと、いい塩梅のSLIとSLOが定まっていくと思います(SLI:Service Level Indicator=サービスレベル指標、SLO:Service Level Objectives=サービスレベル目標)。 そうなったら、次はSLOに揃えてSLAを再設定するべきと思うのですが認識は合っていますか?(SLA:Service Level Agreement=サービスレベル合意)

ご回答

SLI/SLOとSLAは決定要因やライフサイクルが異なるので、いっしょくたにしないほうが良いです。 SLAは一般に双方合意のもとで締結される顧客との契約であり、賠償・補填など何らかの経済的影響を伴います。改定のハードルが非常に高く、いちど締結されるとそれなりに長期に渡り同内容で有効であることが期待されます。 顧客にとってSLAは期待値の拠り所になるもので、提供者にとってSLAは投資判断・資金繰りの拠り所になるものです。 SLIやSLOは適切なものを探索し適宜改定するものですから、SLAとはライフサイクルが異なります。SLI/SLOとSLAが密結合するとSLI/SLOの健全性が損なわれていく可能性が高くなります。 SLAについて改めて考えると、SLAの主要な決定要因は「達成可能性」「経済合理性」「市場競争力」です。
  • 達成可能性:定めたSLAが達成できる可能性があるか、どのくらいの確率で達成できそうか
  • 経済合理性:(一般的にSLAにはペナルティが規定されているので)提供者はSLAを守るための投資と、SLA違反に伴う経済的損失あるいは市場競争力の低下を天秤にかけ、どの程度が合理的か
  • 市場競争力:(SLAの値は横並びで他社比較されやすいので)SLAの値が顧客獲得・維持に効果的か
以上を踏まえて改めてSLI/SLOとSLAについて考えてみます。 SLOの実績があると、上記のうち達成可能性のリスクを読みやすくなります。しかしSLOの実績が直接寄与するのは3要素のうちの1つですから、SLOを即ちSLAにするのは決定要因のバランスを欠いており不適切です。 ただし、いままで達成可能性のリスクがSLA設定上のボトルネックとなっていたのであれば、SLOの実績をもとに”より攻めたSLA”に改定することはありえます。またSLIを参考にSLAの指標(計測方法)として利用者に響く指標を提示できれば、それは市場競争力に寄与する可能性がありますね。

この他のarticleOBServe事例)SRE/オブザーバビリティよろず相談シリーズはこちら


\SRE・オブザーバビリティよろず相談も受付中!/