数日外出して帰宅したところ、MicroServerの特定ドライブのHDDアクセスランプが点灯しない。statusを見るとdegradeしている模様。
zpool statusを見てみると、
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 |
foo@myserver:~$ sudo zpool status [sudo] password for foo: pool: pool state: DEGRADED status: One or more devices could not be used because the label is missing or invalid. Sufficient replicas exist for the pool to continue functioning in a degraded state. action: Replace the device using 'zpool replace'. see: http://zfsonlinux.org/msg/ZFS-8000-4J scan: scrub repaired 0 in 29h51m with 0 errors on Tue Jul 14 06:13:12 2015 config: NAME STATE READ WRITE CKSUM pool DEGRADED 0 0 0 raidz2-0 DEGRADED 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx49 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx31 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx36 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx74 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WMAZA9xxxx83 ONLINE 0 0 0 ata-HGST_HMS5C4040ALE640_PL1331LAxxxxYH-part1 UNAVAIL 4 60 0 corrupted data ata-HGST_HMS5C4040ALE640_PL1331LAxxxxAH-part1 ONLINE 0 0 0 ata-WDC_WD20EZRX-00DC0B0_WD-WMC300xxxx55 ONLINE 0 0 0 errors: No known data errors foo@myserver:~$ |
HGST 4Tドライブに問題がある可能性あり。
gnome-disks でドライブを確認してみる。
s.m.a.r.t.のステータスは緑、セルフテストをしたところ、OKとなった。
対象ディスクのアラームをCLEARしてみる。
1 2 |
foo@myserver:~$ sudo zpool clear pool /dev/disk/by-id/ata-HGST_HMS5C4040ALE640_PL1331LAxxxxYH-part1 foo@myserver:~$ |
で、statusを確認してみると、、
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
foo@myserver:~$ sudo zpool status pool: pool state: ONLINE scan: resilvered 88.6M in 0h0m with 0 errors on Sun Aug 30 18:35:22 2015 config: NAME STATE READ WRITE CKSUM pool ONLINE 0 0 0 raidz2-0 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx49 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx31 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx36 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx74 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WMAZA9xxxx83 ONLINE 0 0 0 ata-HGST_HMS5C4040ALE640_PL1331LAxxxxYH-part1 ONLINE 0 0 0 ata-HGST_HMS5C4040ALE640_PL1331LAxxxxAH-part1 ONLINE 0 0 0 ata-WDC_WD20EZRX-00DC0B0_WD-WMC300xxxx55 ONLINE 0 0 0 errors: No known data errors foo@myserver:~$ |
あっと言う間もなくresilver終了。次はscrubしてみる。
1 |
foo@myserver:~$ sudo zpool scrub pool |
2日かかったけれど無事scrub終了。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
foo@myserver:~$ sudo zpool status [sudo] password for foo: pool: pool state: ONLINE scan: scrub repaired 0 in 30h29m with 0 errors on Tue Sep 1 01:09:54 2015 config: NAME STATE READ WRITE CKSUM pool ONLINE 0 0 0 raidz2-0 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx49 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx31 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx36 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WCAZA6xxxx74 ONLINE 0 0 0 ata-WDC_WD20EARX-00PASB0_WD-WMAZA9xxxx83 ONLINE 0 0 0 ata-HGST_HMS5C4040ALE640_PL1331LAxxxxYH-part1 ONLINE 0 0 0 ata-HGST_HMS5C4040ALE640_PL1331LAxxxxAH-part1 ONLINE 0 0 0 ata-WDC_WD20EZRX-00DC0B0_WD-WMC300xxxx55 ONLINE 0 0 0 errors: No known data errors foo@myserver:~$ |