イベントトラッキング、チャット管理画面で障害が発生しています
Incident Report for KARTE
Postmortem

管理画面、チャット、ユーザー解析にて障害が発生しておりました。

下記の時間帯に、管理画面、チャット、ユーザー解析にて障害が発生しておりました。

■ 発生時間
A.2021/4/9 15:20頃〜17:30頃
B.2021/4/9 15:20頃〜15:35頃
C.2021/4/9 15:20頃〜20:45頃

■ 事象
A.チャット:

  • ノート保存の反映が遅延する
  • エンドユーザーさんへのメッセージ送信遅延する
  • 新着メッセージの受信が画面リロードしないと反映されない
  • 返信後に画面リロードしないとオペレーター側の画面が反映されない

B.ユーザーの解析遅延

C. イベント処理遅延:
トラッキングされたイベントを管理画面への反映が遅れる

■ 原因
GCP内のネットワーク断が原因でございます。
そのため、その影響で派生した各事象の原因は下記となります。
A. GCP内のネットワーク断のため。
B. 一時的に解析の処理過程でGCPのNW上での処理データ量が急激に低下したため。
詳細な原因はGCP側に問い合わせを行っています。
C. ネットワーク断が回復した後、処理されるデータ量が急増したため。

■ 暫定対応
A. アプリケーションの再起動によって復旧致しました。
B. ネットワークの復旧によって自動復旧致しました。
C. 障害の原因のネットワーク劣化によって処理が溜まったデータに対してサーバを強化して対応しました。

■ 今後の対応
今回の事象に対する検知の仕組みの強化。
A. 詳細な調査結果を踏まえ、アプリケーションを修正を検討致します。
B. 詳細の原因をGCPと調査し、対応策を検討致します。
C. データが溜まった際に、効率的に処理されるよう修正致します。

この度はご迷惑をおかけいたしました。

Posted Apr 20, 2021 - 07:58 JST

Resolved
本障害の事象について事象が解消しましたのでご連絡致します。
また影響範囲を広めに記載しておりましたが、調査が進み影響範囲を明確化しましたのでご連絡致します。


A.チャット:
- ノート保存の反映が遅延する
- エンドユーザーさんへのメッセージ送信遅延する
- 新着メッセージの受信が画面リロードしないと反映されない
- 返信後に画面リロードしないとオペレーター側の画面が反映されない

B.ユーザーの解析遅延

C. イベント処理遅延:
トラッキングされたイベントを管理画面への反映が遅れる


A.4/9 15:20頃〜17:30頃
B.4/9 15:20頃〜15:35頃
C.4/9 15:20頃〜20:45頃

この度はご迷惑をおかけいたしました。
Posted Apr 09, 2021 - 22:19 JST
Identified
本障害の状況をご報告致します。
■ 解消済の事象
チャット:
- ノート保存の反映が遅延する
- エンドユーザーさんへのメッセージ送信遅延する
- 新着メッセージの受信が画面リロードしないと反映されない
- 返信後に画面リロードしないとオペレーター側の画面が反映されない

トラッキング:
- トラッキングの遅延

接客の配信:
- トラッキング遅れにより接客の配信されない事象

■ 未解消の事象:
- イベントの処理遅延による管理画面でのイベント表示の遅れ
Posted Apr 09, 2021 - 20:05 JST
Investigating
TALK管理画面で障害が発生しています。

トラッキングの遅延、チャットメッセージ、管理画面にアクセスしづらい状況が
発生しております。

現在、開発チームが調査を行っています。
Posted Apr 09, 2021 - 16:09 JST
This incident affected: イベントトラッキング, 管理画面, 接客の配信, and チャット.