ソースコード、ミドルウェア、クラウドサービスの実装を
網羅的に調査して原因不明のエラーレスポンスを解消。
効果の薄いスペックアップを回避。
ご相談時の課題
いつからか明確にはわからないものの、ある時から確率的にエラーレスポンスが発生。 ユーザーの利用が増えると頻発するように思えるが、ユーザーが少ない時間帯にも発生しており原因が不明。 ユーザークレームに繋がっており解消しなければなりません。 スペックアップをするといくぶん緩和するように感じられるのですが、正直なところ気のせいかもしれません。
- 原因不明・再現性なしの「確率的エラー」が頻発
- ユーザークレームに直結しており解消が急務
- インフラ増強/スペックアップによる対症療法が効果薄
X-Tech5のアプローチと成果
システムの実態を確実に把握するため、ソースコード、ミドルウェアの設定、DBのクエリー、クラウドサービスの設定等を直接解析。 ユーザーにとっての該当機能の用途・用法、実際の処理内容、データフロー等からシステム障害の発生箇所を切り分け、ミドルウェアの設定変更によって問題を解決しました。
ここがポイント:聖域を作らない全方位の調査と解決
「よくあるパターン」や「可能性があるパターン」をいちからあてはめていくのではなく、実態を調査して問題箇所を特定するので、常に説明可能な結果が得られます。
「『目の付け所が違うな』と思ったのですが、説明を受けると推測ではないとわかり、
成長にもつながりました」当初はDBのロックを疑って試行錯誤していましたが、蓋を開けてみると全く異なる箇所が問題の原因でした。 今になって思うと、ミドルウェアはチームの皆が苦手意識がありあまり積極的に調査してこなかった箇所です。
X-Tech5さんがシステム全体に渡って調査・分析してくれたおかげで適切な対応がわかり、ユーザークレームも解消しました。 原因を発見した方法も教えていただき、とても勉強になりました。
