【解消済】イベントトラッキング、接客の配信で障害が発生しています
Incident Report for KARTE
Postmortem

概要

2021年8月12日17:00頃〜18:20頃にかけて、KARTEで発生した障害について、ご報告いたします。

発生した事象は以下のとおりです。各事象の詳細については後述しています。

事象1:接客の配信に関する障害
事象2:イベントトラッキングに関する障害

これらの事象につきましては、現在すべて解消済みとなっています。

事象

- 事象1

対象機能
接客の配信

発生した現象
一部のアクション配信の失敗。1日あたりに換算して、約3.00%に相当するアクションの配信に失敗しました。

- 事象2

対象機能
イベントトラッキング

発生した事象

一部イベントトラッキングの失敗

1日あたりに換算して、約3.00%に相当するイベントトラッキングが行われませんでした。

原因

サーバ更新作業のサーバ台数の増加タイミングに、一部データベースに想定よりもサイズが大きいデータが存在していたことで、該当データベースが高負荷状態となりパフォーマンスが悪化しました。結果として、結果、接客の配信、及び一部イベントトラッキングが失敗しました。

対応

原因となっていたデータと該当データがデータベースに保存されてしまう原因となっていた処理を特定し、修正を行いました。

今後の対策

今回と同様の現象を発生させる可能性があるデータと、それに関連する処理が他にも存在していないか調査を行い、発見した場合は上述と同様の対応を行います。

また、今回のような高負荷にも耐えうるインフラストラクチャの強化やアーキテクチャの検討、サーバ更新時の挙動安定化については引き続き取り組んでまいります。

Posted Aug 17, 2021 - 21:51 JST

Resolved
イベントトラッキング、接客の配信、チャットで発生していた障害が解消いたしました。

現在は各機能が正常に動作することを確認できております。

本障害の詳細につきましては、本Status page上で追ってご連絡いたします。

この度はご迷惑をおかけして、大変申し訳ありませんでした。
Posted Aug 12, 2021 - 19:32 JST
Monitoring
本事象に対する対応を行い、発生していた障害が復旧いたしました。
しばらくの間、監視状態と致します。
Posted Aug 12, 2021 - 18:44 JST
Update
本件の影響により、ユーザーの行動がトラッキングできない、接客サービスが配信されないなどの事象が発生している可能性があります。
また、KARTEサポートへお問い合わせいただくためのチャット導線も接客サービスを利用しているため本事象の影響で開かない状況にあるかと思います。
事象への対応状況についてはこちらのStatuspageにて随時更新していきます。
ご不明な点ございましたら、フォームにてお問い合わせください。
ご不便をおかけし申し訳ありませんがよろしくお願い致します。
Posted Aug 12, 2021 - 17:50 JST
Investigating
イベントトラッキングで障害が発生してます。
現在、開発チームが調査を行っています。
Posted Aug 12, 2021 - 17:38 JST
This incident affected: イベントトラッキング, 接客の配信, and チャット.