Festplatten S.M.A.R.T Status Überwachung
9. Juli 2014
Zur Sicherheit, sollte man die Festplatten überwachen damit diese nach langen Laufzeiten nicht ausfallen. Auch wenn es Raid Systeme gibt, ist dies keine 100% Sicherung. Daher installieren wir Smart Monitortools, Kontrollieren Sicherheitshalber einmal zum Start und richten dann eine permanente Überwachung ein. Installation: apt-get install smartmontools Aktivierung: Wir müssen das Tool für jede Festplatte einzelnd […]

Zur Sicherheit, sollte man die Festplatten überwachen damit diese nach langen Laufzeiten nicht ausfallen. Auch wenn es Raid Systeme gibt, ist dies keine 100% Sicherung.
Daher installieren wir Smart Monitortools, Kontrollieren Sicherheitshalber einmal zum Start und richten dann eine permanente Überwachung ein.
Installation:
apt-get install smartmontools
Aktivierung:
Wir müssen das Tool für jede Festplatte einzelnd aktivieren.
smartctl -s on /dev/sda
smartctl 5.41 2011-06-09 r3365 x8664-linux-3.2.0-65-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.
Jetzt prüfen wir, ob die Festplatte defekte Sektoren hat. Relevante Zeilen markiere ich.
smartctl -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x8664-linux-3.2.0-4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Always - 0
2 Throughput_Performance 0x0005 139 139 054 Pre-fail Offline - 71
3 Spin_Up_Time 0x0007 100 100 024 Pre-fail Always - 0
4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 4
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 124 124 020 Pre-fail Offline - 33
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 2190
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 4
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 4
193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 4
194 Temperature_Celsius 0x0002 127 127 000 Old_age Always - 47 (Min/Max 23/51)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 1
Hier sieht man, das alles perfekt ist. Hier einfach am besten schauen was so optimale Werte sind, da die je nach Festplatte Variieren.
Man kann auch mit dmesg zusäztlich I/O Erros anschauen.
Sollte hier was zu sehen sein, sollte man die Seriennummer für den Austausch auslesen.
Diese gibt man dort an die Mitarbeiter des Hosters weiter bzw. schaut selbst damit man die korrekte austauscht.
smartctl -i /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Device Model: TOSHIBA DT01ACA300
Serial Number: Z35EYLBGS
LU WWN Device Id: 5 000039 ff4d46f6a
Firmware Version: MX6OABB0
User Capacity: 3.000.592.982.016 bytes [3,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Wed Jul 9 17:34:05 2014 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Nach dem Austausch kann man den Raid einfach wieder hinzufügen.
Festplatten überwachen anschalten:
Um eine Email Notification zu aktivieren, muss man einfach nur der Konfiguration bescheid sagen, das man gerne den S.M.A.R.T. Health Status benachrichtig werden möchte. In der /etc/smartd.conf muss die DEVICESCAN Zeile angepasst werden.
DEVICESCAN -d removable -n standby -H -l error -l selftest -m [email protected] -M exec /usr/share/smartmontools/smartd-runner
Der Dienst smartd sollte im Autostart sein und laufen.
update-rc.d smartd defaults
/etc/init.d/smartd start
Kommentare
Kommentare werden geladen...