8月23日午後1時ごろに発生した、米Amazon Web Servicesのクラウドサービス「AWS」の東京リージョンでの障害について、同社は午後8時18分、クラウドサーバの復旧がほぼ完了したことを明らかにした。制御システムの障害により、サーバの温度が上がりすぎたことが原因だったという。ところで、その「複数の冗長化冷却システム」は福島原子力発電所と同じで、システムの信頼性を保障するためのものです。理想的には、いかなる状況に置かれてもシステムが正常に動作してほしいです。原子力発電所は最悪周囲に物理的な損害をもたらす可能性はあります。インターネットのサービスは、まず様々な電子取引の障害による金銭的な損失をもたらす可能性があります。そのサービスと連動する物理的なサービスがあれば、さらに物理的な損害、場合によって人命の被害まで考えられます。
同社によると問題が起きたのは、「Amazon Elastic Compute Cloud」(EC2)の東京リージョンを構成する4つのデータセンター(アベイラビリティーゾーン、AZ)の内の1カ所。AZ内の制御システムに問題が発生し、複数の冗長化冷却システムに障害が起きたという。結果として、AZ内の少数のEC2サーバが過熱状態となり、障害として表面化したとしている。
サーバの過熱というのは、素人から見れば、途轍もなく初歩的な問題で、いくらでもお金をかけられる重要な商業用サーバーでは起こり得ないことだ思われます。しかし、それは、天災や故意の操作などの外因が無い状態で起きてしまっています。
できれば、インターネットサービスに頼り過ぎないように心がけたいです。