イベントをトリガーとする接客サービスの配信に失敗に関する障害について、下記の通りご報告致します。
発生期間
2022年5月23日 23:28頃〜23:40頃
対象のプロジェクト
KARTE Insight と KARTE Action を利用中の全プロジェクト
発生した現象
発生原因
データベースとの接続不良によりイベントキューが滞留後、イベントキューを解消する際に一度に大量のイベントを処理したため
通常の自動スケールアウトが間に合わず想定以上の負荷がかかり、接客サービスに影響がでてしまった
実施した対応
手動にてサーバーのスケールアウトを行いました
今後の対応
イベントのキューが溜まった際に、サーバーの自動スケールアウトをスムーズ行えるようにし、
一部のサーバーが過負荷になった場合、他に影響を与えないようにします
この度はご迷惑をおかけし、大変申し訳ございませんでした。