4日前からサーバーの調子がおかしくなって、昨日の時点で解決したようでした。
私が利用している時間帯では障害が起きていなかったので、全然気づいていません。アップタイム監視サイトからの障害報告で何かが起きているのは分かりました。
その後、利用者だけが読めるSparkSpaceのアナウンスメントを確認したところ、確かに私の乗っているサーバーが調子がおかしくて、再起動されていました。一度は解決されたように思ったらしいですが、再度発生した様子で「追記:まだ解決していません。ログをたくさん取るようにする」と書かれていました。
本日の日本時間早朝に、メールが来ていまして、原因が書かれていました。あるユーザーの作ったPHPプログラムが一時的にCPUを100%を利用していたための障害でした。それは一時的かつ起動時間が一定で無かったために、発見しづらかった旨、書かれておりました。そのユーザーのサイトを凍結して、全部解決されたそうです。
今回の件でPHPについての制限を付け加えるとのことでした。内容はまだ見つけていません。
今までのアナウンスメントを読んでいたのですが、外部の攻撃とかは対処しているようなので、何が原因かと思ったら、やはり犯人は内部にいたようです。
それは、共有サーバーですのでしかたがないのですが、アップタイム監視サイトを利用しているアップタイムの記録が、今回のせいでやたらと低くなってしまいました。
ただ、記録を読んでみましたが、実際はそんなに長時間落ちていたというわけでなく、一時的なアクセス不能が監視時間に重なったために、長時間のダウンに見えたと言うことらしいです。
まあ、今回の件を鑑み、アップタイム監視の頻度を増やすことにしました。Pingdomは無料版では6カ所ある監視ポイントからランダムに一つを選んでアクセスしてもらえますが、この頻度を15分から1分単位に変更しました。これで細かいアップダウンの情報を得られると思います。BinaryCanaryは3カ所から選択できますが、今まで通り3カ所全部から監視のままにし、監視間隔を30分から15分に変更です。
それとkore1server.comにアクセスしていましたが、このサイトは情報量が多く、毎分アクセスされると通信量が極端に増加して、後からログを読むときに困るので、比較的少ないhtmlページのuptime.qanxen.infoへアクセスするように切り替えました。両方とも同じSharkSpaceのサーバー上で動作している私のサイトです。
これで、次回の障害発生時には、もっと詳しいレポートが出来そうです。
| このサイトは...< 前 |
|---|
| < 前 |
|---|