keyboard_double_arrow_up

監視や障害対応にいまいち自信がない、アラートが多くて無視している、
モニタリング・オブザーバビリティ投資が過剰な気がする・・・
モニタリングのプロフェッショナルと
ちょうどいいシステム監視を実現
X-Tech5のクリアボックスメソッドで
モニタリング・監視・アラート対応のモヤモヤをクリア

モヤモヤをクリアにする
X-Tech5の
クリアボックスメソッド

「とりあえず入れた監視」「しょっちゅう鳴るアラート」…コストをかけているのに活用できずアラート疲れ無駄な投資になっていませんか?

今の自分たちにちょうどいい 監視/モニタリング/オブザーバビリティはサービスの稼働環境やシステム特性、事業フェーズ、組織・体制や組織文化によっていい塩梅が違います。しかしツールやプラクティス頼みでは実現できず、専門家がおらず実践的なノウハウがないため現場は苦労して試行錯誤しています。

OBServe Liteご提供内容

クリアボックスメソッド

モニタリング・監視・オブザーバビリティのモヤモヤをクリアにする、X-Tech5独自のドキュメントテンプレート集とノウハウをご提供します。

システム監視の専門家であるX-Tech5のエンジニアがメソッド適用に取り組むので実践的です。

単にテンプレートを適用するだけでなく、システム監視の専門家が取り組むのが最大の利点です。クリアボックスメソッドを適用する過程で貴社メンバーの不安やモヤモヤをクリアにしていきます。

内容例
  • 監視仕様書、対応手順書、モニタリング実装、ログ・トレース・イベント収集定義
  • モニタリングダッシュボード
  • 定点観測会実践ガイド、定点観測会メニューテンプレート、定点観測会運用ガイド
  • ポストモーテムガイド、ポストモーテムテンプレート

お悩み解決事例
  • 監視設定をひとつ変更するだけでアラートを60%削減

X-Tech5のOBServe Liteは独自のクリアボックスメソッドを活用し、このようなよくある現場課題を解決します
  • 開発生産性を取り戻したい: ひっきりなしのアラートによる業務中断をなくし集中力を取り戻す
  • 重要なアラートを見逃したくない: 無視運用するアラートをなくし本当に対応が必要なアラートサービス停止につながる予兆を漏れなくキャッチ
  • なんとかしたいがメンバーの稼働は割けない: 専門家がおらず効率よく改善できない。そもそも手が回らないし、メンバーが時間と工数をかけて習熟する価値があると判断しきれない

システム監視の専門家と一緒モヤモヤをクリアにして『今の自分たちにちょうどいい』 モニタリングを実現しませんか。

クリアボックスメソッドの
適用アプローチ

定点観測会

サービスの状態を定期的継続的にチェックして、サービスレベル・投資・運用稼働・モチベーションのバランスをとります。

ベテランのエンジニアが監視ツールの設定、実装だけでなく、アプリケーションプログラムのソースコードまで追跡します。意図がわからない監視項目も、X-Tech5にお任せでアラートの原因や監視項目の意味・意義を的確に把握し改善します。

お悩み事例
  • 障害対応の事後フォローアップが回っておらず再発しがち
  • データはあるのに見逃して機会損失やコストの無駄が起きている
  • 大障害を未然防止して顧客満足低下やお詫び稼働を回避したい

メンタリング

エンジニアリングに関わるあらゆることを気軽に相談できる環境が変化と安定化を支えます。

相談事例
  • 監視項目が多すぎる気がする
  • アラートを減らしたいが何から手を付けていいかわからない
  • 障害対応を手伝って欲しい、パフォーマンスチューニングを一緒にやってほしい

オプションサービス

監視と障害対応全体のアセスメント

X-Tech5が現状のソースコードやインフラ・クラウドサービスを直接調査して、監視項目、監視設定、障害対応手順、障害対応ワークフロー、インシデントマネージメント、オブザーバビリティを全体に渡って詳細にアセスメントします。

お客さまの事業フェーズや体制をもとに、一般的なあるべき姿ではなく「いまのお客さまにちょうどいい」また「次の0.5歩/一歩にちょうどいい」姿を提言します。

アラート設定・実装変更
通知先の整理・厳選
対応手順の再整備
監視設定のコード化
SLI/SLO設計・実装

監視と障害対応全体の設計および実装

X-Tech5が現状のソースコードやインフラ・クラウドサービス、事業フェーズ、体制などを踏まえて、監視と障害対応全体を設計および実装します。

アセスメントと同様に、身の丈にあった、地に足のついた実装がポイントです。

対応自動化
対応メンバーの育成
対応体制・対応フローの再設計
ダッシュボード実装

mailお問い合わせ

プロフェッショナル

モニタリングの専門書『Webエンジニアのための監視システム実装ガイド』、
Webパフォーマンスチューニングの専門書『達人が教えるWebパフォーマンスチューニング』の著者とエキスパートがご対応します。

技術統括責任者 馬場 俊彰

技術統括責任者 馬場 俊彰 Toshiaki Baba
電気通信大学卒業後、大手カード会社のWeb サイトを開発・運用するJavaプログラマを経て、MSP事業会社で取締役CTOとして従事。産業技術大学院大学に入学し無事修了。現在、X-Tech5のCTOへ就任。Webシステムインフラ、監視テクノロジに関する著書多数。 Amazon著者ページ

  • 監視システムとサービス監視のエキスパートエンジニア
  • 監視設計・実装だけでなく障害対応やパフォーマンスチューニングの専門家
  • CTOとして監視/モニタリング/オブザーバビリティとビジネスの最適化に従事
代表取締役 石田 知也

代表取締役 石田 知也 Tomoya Ishida
財務省入省後、電子申告基盤に関するPJに参画。コンサルティングファーム系SIerを経て、国内大手クラウドインテグレーターにエバンジェリスト·ソリューションアーキテクト·事業責任者として参画。その後、パラレルキャリアを経てX-Tech5を設立し、ユーザ体験フォーカスした運用技術を提供。

  • エンジニアリングの事業化・組織化のエキスパート
  • 運用の組織化や組織的実装を実現する専門家
  • 監視の組織的実装の再構築経験多数

ご提供事例

Webサービス提供企業様

導入前の状況

アラートが多く「いつもの、よく出ているものだな」と流しがちでした。 アラートは多いのにユーザー影響のある障害はうまく検知できておらず、ユーザーからの問い合わせで気づくことがしばしばありました。 状況のリスクや状況改善の必要性は認識してはいたものの、問い合わせ対応や機能開発にかかりきりで手を割けていませんでした。

X-Tech5がまず「いつもの」アラートを削減し、次に監視項目と閾値と手順を全面的に見直し、その後の継続的な調整を行いました。

導入後の状況

X-Tech5の取り組みにより緊急連絡用のチャットルームに対応不要のアラートが届くことはほぼなくなり、非常に健全な緊張感を持って対応できるようになりました。

また継続的な調整の中で監視を活用する方法と最適化していく段取りを体験的に習得しています。

mailお問い合わせ

ご提供までの流れ

リモートで打合せを2回ほど行い、お互いの相性の確認と期待値の擦り合わせを行います

ワークショップを開催します

  • お客さま→X-Tech5:現状の課題や課題感を共有いただきます
  • X-Tech5→お客さま:課題や課題感に対して”X-Tech5ならどのように考えてどうアプローチするか”を提案、ディスカッション

限られた情報をもとに少ない時間で検討・提案するため、提案のHowをそのまま採用すべきケースはそう多くありません。具体的な対処法そのものではなく、考え方や課題の見定め、課題へのアプローチの仕方がマッチするかをお互いに確認。結果にいたる構造を整えられるか、お互いに見極めます。

ご提供パターン

典型的に始めの3ヶ月で道筋をつけます。


0ヶ月目

  • キックオフミーティングを行いご提供開始です。
  • 事前に閲覧可能な資料があればいただいて拝見します。

1ヶ月目

  • ソースコード、営業資料、設計資料、開発資料、稼働環境、既存の監視機構のアクセス権をいただき状況を調査します。
  • 特にいままで発生した障害やいま発生している、最近よく発生するアラートがポイントです。
  • 現状の不満・不安を深くお伺いして、不満や不安をリセットするための道筋をたてます。
  • 明らかに不要なアラートはバンバン抑止します。

2ヶ月目

  • 1ヶ月目で行った対処の経過を観察しつつ、重くない定点観測の型を作ります。
  • アラートの抑止をさらに推し進めます。
  • 必要に応じてアラートの代替案を検討します。
  • この頃にはだいぶアラートが減り安心感が出てきます。

3ヶ月目

  • 1ヶ月目・2ヶ月目で行った対処の経過を観察します。
  • 定点観測会はじめ実務の内製化に取り組みます。

対応ツール

  • チャット: Slack、Teamsなど
  • ビデオ会議: Google Meet、Zoomなど
  • チケット: Backlog、Jira、GitHubなど
  • 監視サービス: Datadog、New Relic、Amazon CloudWatch、Google Cloud Monitoring、Sentry、Mackerel、Nagios、Zabbixなどなんでも

お問い合わせ


SRE・DevOps・オブザーバビリティ
の実現・定着で
『今日より、一歩前へ』

SREサービス

詳しくはこちら

オブザーバビリティ運用の
システムと組織への定着を促す

OBServe

詳しくはこちら

Webエンジニアのための
モニタリング・オブザーバビリティ

実践ガイド

詳しくはこちら