8月29日の夜に発生した落雷によりサーバの一部が故障してしまい、本日までサイトが停止していました。
今回故障した箇所はが仮想マシンとサイトのコンテンツを格納しているファイルサーバであったことから、復旧に非常に時間がかかりました。
落雷のサージ電流によりサーバが物理的に故障してしまい、起動しなくなってしまいました。幸いにもRAID HBAとデータは無事でしたが、基幹部品の交換とシステムの再構築が必要となりました。
コンシューマ用機材を使用して構築していますので、突貫で交換部品の選定と手配をおこないました。
システム構成の関係からRAID HBA 2枚と4port NIC 1枚を組み込む必要があり、これを実現するにはPCIe x8 2本とPCIe x4 1本のバスが必要となります。この構成をコンシューマ向け機材で実現するには、非APUのAMD RyzenとPCIe x1のグラフィックボードを使うか、Intel系CPUを使う以外の選択肢がありませんでした。
AMD系のシステムは適合するパーツを確保することが難しかったため、今回はIntel系のシステムで再構築することになりました。交換用部品としてはCPU + M/B + Memoryの他にOSインストール用にM.2接続のSSDを調達しました。
構成 | 旧システム | 新システム |
CPU | AMD Opteron 3260HE (2.7GHz 4c) | Intel Core i3 8100 (3.6GHz 4c) |
M/B | ASUS SABER TOOTH 990FX | ASRock Z370 Extreme 4 |
Memory | DDR3 -1600 16GB | DDR4-2400 8GB |
OS | CentOS 5 | CentOS 7 |
居住空間に設置していることから綿埃が溜まっていましたので、ついでに完全に清掃することにしました。
OSの導入と基幹システムの再構築は問題なく進みましたが、仮想マシン格納領域用のiSCSIターゲット機能が正常に動作せず、この部位の問題はまだ解決していません。
とりあえず暫定復旧していますが、本復旧は手隙の時に進めますのでサイトが応答しないタイミングが時々発生することになります。