【解決済み】イベントトラッキングや接客の配信等で障害が発生していました
Incident Report for KARTE
Postmortem

この度発生した接客の配信に関する障害について、下記の通りご報告致します。

■ 発生期間
2022/11/16 22:18頃〜22:40頃

■ 対象のプロジェクト
KARTE InsightやKARTE Actionを利用中の全プロジェクト

■ 発生した現象

  • イベントのトラッキング完了までに過度に時間がかかるケースが一時的に増加した
  • その結果、一部のイベントを配信トリガーとする接客サービスの配信・実行が失敗した(全プロジェクトに対して1日あたりに換算すると約2.08%に該当)

■ 発生原因

  • リアルタイム解析にて使用するデータベースのパフォーマンスが該当時間帯に急激に劣化した
  • そのパフォーマンス劣化によって一時的に処理リソースが過負荷となり、処理時間が急増した

■ 実施した対応

  • 障害発生期間の終盤にデータベースの自動スケール機能によってデータベースのリソースが増強され、パフォーマンスが自然と解消された
  • 手動でリアルタイム解析処理リソースを増強し、過負荷状態を解消した

■ 今後の対応

  • クラウドプロバイダーへデータベースのパフォーマンス劣化の原因問い合わせ及び、対応検討
  • データベースの自動スケールのタイミングを早めるよう調整
  • リアルタイム解析処理リソースの自動リソース増強

この度はご迷惑をおかけしてしまい、誠に申し訳ございませんでした。

Posted Nov 17, 2022 - 15:44 JST

Resolved
以下の期間において障害が発生し、解消したことをご報告します。

■ 発生期間
2022/11/16 22:18頃〜22:40頃

■ 対象のプロジェクト
KARTE InsightやKARTE Actionを利用中の全プロジェクト

■ 発生した現象
- イベントのトラッキング完了までに過度に時間がかかるケースが一時的に増加した
- その結果、一部のイベントを配信トリガーとする接客サービスの配信・実行が失敗した(全プロジェクトに対して1日あたりに換算すると約2.08%に該当)

この度はご迷惑をおかけし、大変申し訳ございませんでした。
なお、本障害の詳細や事後対応については、追って記載します。
Posted Nov 16, 2022 - 23:02 JST
This incident affected: イベントトラッキング and 接客の配信.