- 会員限定
- 2016/01/27 掲載
GMOの24時間にわたるサービス障害、原因の発見と復旧に時間がかかった要因とは
また、障害の原因は「データセンター内における電源設備の一部故障」とされました。
24時間という長時間かつ広範囲に発生した障害の実態はどうだったのか、また原因とされた電源設備の一部故障とはどのようなものだったのか、GMOインターネットの発表は詳細部分について触れられていなかったため、PublickeyではGMOインターネットに対して取材を申し込みました。
GMOインターネットの広報窓口からは「当社としても正確にお伝えすべきと、お受けする方向で考えておりますが、現在、インタビューに対応可能な担当者が再発防止策を最優先に取り組んでいるため、社内にいない時間も多くなかなか捕まらない状況です」との返答をいただき、対面での取材はむずかしいとのことだったため、送付した質問に書面で回答をいただくこととなりました。
以下、GMOインターネットよりいただいた回答を、ほぼそのままの形で掲載します。
変電分電盤のタイマーリレーに動作不良を確認
──障害の状況について、具体的に教えてください。例えば、お名前.comのドメイン名サービス、お名前.comレンタルサーバ、ConoHa byGMO、アプリクラウドなどについて、障害発生時刻や状況、復旧時刻などはどうなっていますでしょうか。回答:下記の一覧表をご覧ください。
発生時刻:2016年1月16日14時15分頃から1月17日14時25分まで(左記時間はすべてのサービスの復旧が完了した時刻になります。サービス毎に復旧時刻が異なります)
──「データセンター内における電源設備の一部故障」について教えてください。故障の直接の原因、および規模としてデータセンターの全電源喪失だったのか、一部喪失だったのか、冗長化電源は機能しなかったのかなど。
回答:現在詳細な原因調査の最中のため、断定はできませんが、変圧分電盤の一部部品(タイマーリレー:限時継電器)に動作不良が確認できており、おそらく当該部品の故障で通電不可状況に陥ったと思われます。
なお、本件発生時の状況としては電源の瞬断が複数回あり、瞬断後は電源が自動復旧しておりました。それらのエラー内容により、もっとも推測できる箇所から調査を開始しました。そのため、原因把握までに時間を要しました。
また、電源喪失の範囲ですが、とあるデータセンターの一部(約12%)となります。
なお、当社サービスは複数のデータセンターに分散して管理しております。そのため、今回の対象範囲は、同じサービスであっても影響の出たお客様と出なかったお客様がいらっしゃいます。
【次ページ】 広範囲のサービスに影響した理由、今後の対策
関連コンテンツ
PR
PR
PR