ITシステムのクラウド移行が進み、コンテナやサーバーレスファンクションなどのクラウドネイティブ技術の採用が進むにつれて、運用における新たな概念である「オブザーバビリティ」への注目が高まっています。
しかしながらオブザーバビリティは「これをすれば(ツールを導入すれば)すべて解決」というものではなく、概念としての解釈や取り組み方は、サービスの稼働環境やシステム特性、あるいは組織・体制や企業文化(カルチャー)などの要素によって異なります。
このページでは、オブザーバビリティが求められる背景と課題、従来のシステム監視(モニタリング)との違い、そして、どうすればオブザーバビリティが実現でき、運用として定着するのか?について解説します。
オブザーバビリティを推進する
上での理想と現実(課題)
オブザーバビリティとは?
従来のシステム監視(モニタリング)と何が違い、どうすれば実現できる?
オブザーバビリティとは、「Observe(観察する)」+「ability(能力)」。「Observability(可観測性)」と訳されます。端的に言えば「観察する能力」であり、もう少し分かりやすく言えば、「ITシステム全体を、容易かつ的確に事象を捉え・観察して、正確な対処につなげられるか」を目指すものです。
オブザーバビリティと従来のシステム監視(モニタリング)の違いとしては、「システム監視(モニタリング)は既知の問題を主に取り扱い、オブザーバビリティは未知の問題を主に取り扱う」と捉えるとわかりやすいです。どちらも相互に補完し合うものであり、オブザーバビリティが上位互換というわけではありません。
- 従来のモノリシック型システムが対象
- 監視ツールが対象別にサイロ化
- 担当者間で情報が分断
- コンテナやマイクロサービスなどクラウドネイティブなシステム、アプリ、ビジネスへの影響までが対象
- 統合的に計測データを可視化
- 情報共有により問題への対処が迅速化
従来のシステム監視(モニタリング)は、サーバのCPUやメモリを基準としたメトリクスの異常・Webアクセスの失敗・ログに出力されるエラーなど、「何かが起きた時に異常を検知する」観点で必要です。
一方、オブザーバビリティはサービス利用者のUX(ユーザ体験)を意識してサービス全体を可視化することにより「早期に異変に気づき、UX(ユーザ体験)を損ねる事態が生じる前に対処する」観点で必要になります。
そのためオブザーバビリティでは、以下の3つのデータを連携させ、早期に対処すべき箇所・原因を特定できるようにすることが大切です。
では、上記のデータを連携させるツールを導入すれば、オブザーバビリティが実現するのでしょうか?答えは否です。
サービス利用者に対し最良かつ継続的なUX(ユーザ体験)を提供するためには、これまで役割の違いで分断・対立する関係にあった「開発(Development)」と「運用(Operations)」が緊密に連携し、柔軟にスピード感を持ってシステム開発を行う「DevOps(デブオプス)」の手法を取り入れる必要があります。
「オブザーバビリティ」によるサービス全体の「可観測性」は、役割の違う開発と運用が緊密に連携して同じゴールに向かうための、同じ尺度でサービス全体を可視化・事象を捉えるための取り組みです。
「オブザーバビリティ」は、「DevOps」と共に実行することで、コツコツと継続的なサービス改善を可能にし、その効果を最大限に発揮するのです。
オブザーバビリティ運用のシステムと組織への定着を実現する
「OBServe(オブザーブ)」とは?
企業や組織のITシステム運用現場は日々の業務に追われ、時間やリソースを投資して自組織の課題を解消することが難しく、利用するツールだけが増える、効率化を図るはずがかえって運用負荷が増加してしまうといった、「負のスパイラル」に陥ることがしばしばあります。
私たち株式会社X-Tech5は、このような「困りごと」に対し、複雑に絡み合った要因を解きほぐし、
真因を追求して解決に導くことを強みとしています。
オブザーバビリティ運用の定着を実現する「OBServe(オブザーブ)」は、以下を提供します
*オブザーバビリティ実行前のケースにも、ツール選定などから対応可能です。
オブザーバビリティ運用を定着+DevOps化を推進。
「早期に異変に気づき、データドリブンでUX(ユーザ体験)を損ねる事態が生じる前に対処」
が可能な組織へと変革!
ご提供事例
ヘルスケアSaaS提供企業様
導入前の状況
ユーザーからの問い合わせに回答するために、アプリケーションがどう動いていたかを推定し把握するのに時間と工数がかかって困っていました。 以前はログとメトリクスからなんとか推定していました。
X-Tech5が伴走してNew Relicを導入し、ログ・メトリクス・トレースを一気通貫で調査し挙動を把握できるようになりました。 業務上必要な情報を集めるために必要なログやミドルウェアメトリクスが多岐にわたり網羅するのが大変でしたが、X-Tech5の支援で乗り越えました。
導入後の状況
New Relicが便利だとわかってはいるものの、導入当初は "慣れた以前の調査方法" で対処しがちでした。X-Tech5とNew Relic活用実演やハンズオンを繰り返し実施して、今ではスムーズにNew Relicを活用できるようになりました。 また以前は監視システムを障害や問い合わせありきで使っていましたが、いまはX-Tech5による定点観測会を軸にNew Relicを活用し、プロアクティブな予防的対応ができるようになりました。
問い合わせとして顕在化していないエラーやパフォーマンス問題も認識できるようになり捗っています。 Browserモニタリングも一緒に導入したのでユーザー体験が把握できるようになり、データをもとにして的確なに開発優先順位を決められるようになりました。
IoT Webサービス提供企業様
導入前の状況
Datadogを導入し活用していましたが、開発チームと協働しオブザーバビリティの取り組みを社内に広げるのに苦労していました。
他チームとの協働の軸を定点観測会に据えていて、定点観測会の準備や遂行をX-Tech5が担っています。 X-Tech5はDatadogの使い方・データの読み方だけでなく、SLOやMonitor・Logなどの監視設定、ダッシュボード更新、TerraformでのInfrastructure as Codeも担当しています。
導入後の状況
定点観測会が継続的に開催できており、関係者の継続的なタッチポイントになっています。 コストやパフォーマンスを振り返る絶好の機会にもなっていて、健全なサービス運営を支えています。
ご提供方式
「OBServe(オブザーブ)」は、オブザーバビリティ運用を定着するまでのスピード感・予算感・お客様側のエンジニアアサイン状況に応じて、以下の3つの方式から選択いただけます。
- 1代走
- お客様に代わり、弊社エンジニアが業務を行います
- 2伴走
- お客様と一緒に業務を行い、弊社エンジニアがサポートします
- 3コーチ
- お客様が業務を行い、弊社エンジニアがコーチ(質疑対応や助言)します
*当初は「代走」で進め、定着具合いを見ながら「伴走」や「コーチ」へのシフトも可能です。
ご提供までの流れ
リモートで打合せを2回ほど行い、お互いの相性の確認と期待値の擦り合わせを行います
ワークショップを開催します
- お客さま→X-Tech5:現状の課題や課題感を共有いただきます
- X-Tech5→お客さま:課題や課題感に対して”X-Tech5ならどのように考えてどうアプローチするか”を提案、ディスカッション
限られた情報をもとに少ない時間で検討・提案するため、提案のHowをそのまま採用すべきケースはそう多くありません。具体的な対処法そのものではなく、考え方や課題の見定め、課題へのアプローチの仕方がマッチするかをお互いに確認。結果にいたる構造を整えられるか、お互いに見極めます。
ご提供価格
- 1.モニタリング項目の検討
- 2.モニタリングツールの選定と初期実装
- 3.モニタリング結果に対するOODAループ(観察・状況判断・意思決定・実行)の実施・モニタリング項目のチューニング
- 4.「開発(Development)」・「運用(Operations)」両者が同じ物差しでサービス全体を俯瞰し・事象を捉え・行動を起こすための定点観測会の実施
※消費税別途