KARTEの管理画面、Messageβの配信、Datahubの一部機能にて障害が発生しています
Incident Report for KARTE
Postmortem

この度発生したKARTEの管理画面、Messageβの配信、Datahubの一部機能に関する障害について、下記の通りご報告致します。


発生期間

  • KARTE管理画面で表示が失敗する可能性があった期間

    • 2024/05/30 17:07頃 〜 2024/05/30 18:20頃
  • MessageβやDatahubで、通常よりも遅延や失敗が発生する可能性が高かった期間

    • 遅延:2024/05/30 17:00頃 〜 2024/05/30 19:00頃
    • 失敗:2024/05/30 18:22頃 〜 2024/05/30 19:24頃

対象のプロジェクト

  • KARTEを利用中の全プロジェクト

発生した現象

  • KARTEの管理画面で表示に失敗することがありました。
  • 次の配信や実行に失敗する可能性、及び通常よりも時間がかかる可能性がありました。

    • ターゲット配信
    • Messageβ
    • Datahubのクエリ実行
    • Datahubのジョブフロー

発生原因

  • 利用しているデータベースのジョブの数や負荷が上昇した結果、処理可能な量を超えたため。

実施した対応

  • 負荷の高いSQLの実行をキャンセルしました。

今後の対応

  • データベース内での処理やスケールについて、負荷が集中しないように設定値等の見直しを行います。
  • 再発時に迅速に対応できるように監視を見直します。

この度はご迷惑をおかけしてしまい、誠に申し訳ございませんでした。

Posted Jun 10, 2024 - 15:03 JST

Resolved
障害が解消したのでご報告します。

■ 対象プロジェクト
- KARTEを利用中の全プロジェクト

■ 発生期間
- KARTE管理画面で表示が失敗する可能性があった期間
- 2024/05/30 17:07頃 〜 2024/05/30 18:20頃
- MessageβやDatahubで、通常よりも遅延や失敗が発生する可能性が高かった期間
- 遅延:2024/05/30 17:00頃 〜 2024/05/30 19:00頃
- 失敗:2024/05/30 18:22頃 〜 2024/05/30 19:24頃

■ 発生した現象
- KARTEの管理画面で表示に失敗することがありました。
- 次の配信や実行に失敗する可能性、及び通常よりも時間がかかる可能性がありました。
- ターゲット配信
- Messageβ
- Datahubのクエリ実行
- Datahubのジョブフロー

■ 実施した対応
- 負荷の高いSQLの実行をキャンセルしました。

この度はご迷惑をおかけし、大変申し訳ございませんでした。
なお、本障害の詳細や事後対応については、追って記載します。
Posted May 30, 2024 - 22:03 JST
Update
現在、障害解消のための対応を行い、影響の詳細調査を行っています。
Posted May 30, 2024 - 19:27 JST
Investigating
KARTEの管理画面にて障害が発生しています。
想定される主な影響は次の通りです。

■ 対象プロジェクト
- 全プロジェクト

■ 発生している現象
- Insight、Actionの画面で表示に失敗することがあります。
- その他の管理画面についても影響が考えられ、現在調査中です。

現在、開発チームが原因を調査中です。
約1時間以内に続報を掲載します。
Posted May 30, 2024 - 18:09 JST
This incident affected: 管理画面.