Przewodnik po narzędziu smartctl w smartmontools dla systemu Linux
Wprowadzenie
smartctl to narzędzie wiersza poleceń, które jest częścią pakietu smartmontools, który zapewnia narzędzia do monitorowania i zarządzania stanem urządzeń pamięci masowej, takich jak dyski twarde i dyski SSD. Umożliwia ono użytkownikom sprawdzenie stanu atrybutów technologii SMART (Self-Monitoring, Analysis, and Reporting Technology) w ich dyskach, pomagając wykryć wczesne oznaki awarii dysku. Ten przewodnik przeprowadzi Cię przez instalację, podstawowe użycie i typowe polecenia smartctl dla użytkownikówLinuksa .
Czym jest SMART?
SMART (Self-Monitoring, Analysis, and Reporting Technology) to funkcja wbudowana w większość nowoczesnych dysków twardych i SSD, która monitoruje różne atrybuty, takie jak temperatura, błędy odczytu i czas rozruchu. Atrybuty te mogą dać wgląd w kondycję i żywotność dysku, umożliwiając użytkownikom przewidywanie potencjalnych awarii i podejmowanie działań, takich jak tworzenie kopii zapasowych danych lub wymiana dysku przed wystąpieniem katastrofalnej awarii.
Instalacja smartmontools
Przed użyciem smartctl należy zainstalować pakiet smartmontools. Większość dystrybucji Linuksa ma ten pakiet dostępny w swoich repozytoriach. Użyj odpowiedniego polecenia dla swojej dystrybucji, aby go zainstalować:
- Debian/Ubuntu:
sudo apt-get update
sudo apt-get install smartmontools
- CentOS/RHEL:
sudo yum install smartmontools
- Fedora:
sudo dnf install smartmontools
- Arch Linux:
sudo pacman -S smartmontools
Po instalacji można rozpocząć korzystanie z polecenia smartctl do sprawdzania i zarządzania urządzeniami pamięci masowej.
Sprawdzanie stanu dysku za pomocą smartctl
smartctl to wszechstronne narzędzie, które może być używane do różnych zadań, takich jak sprawdzanie stanu dysku, uruchamianie testów i wyświetlanie szczegółowych informacji o dyskach. Poniżej znajduje się kilka typowych poleceń smartctl i ich opisy.
1. Wyświetlanie podstawowych informacji o dysku
Aby wyświetlić podstawowe informacje o urządzeniu pamięci masowej, takie jak numer modelu, numer seryjny i wersja oprogramowania układowego, należy użyć następującego polecenia:
sudo smartctl -i /dev/sdX
Zastąp
/dev/sdX
/dev/sda
/dev/sdb
2. Sprawdzanie ogólnego stanu dysku
Aby szybko sprawdzić, czy dysk jest zdrowy, użyj:
sudo smartctl -H /dev/sdX
To polecenie wyświetli prosty komunikat “PASSED” lub “FAILED”, wskazując, czy dysk wykrył potencjalne problemy. Jest to szybki sposób na określenie, czy konieczne jest dalsze testowanie.
3. Wyświetlanie wszystkich atrybutów SMART
Aby uzyskać szczegółową listę wszystkich atrybutów SMART monitorowanych przez dysk, użyj:
sudo smartctl -A /dev/sdX
Polecenie to zapewnia szczegółowe statystyki, takie jak temperatura, wskaźniki błędów odczytu i liczba ponownie przydzielonych sektorów. Oto kilka kluczowych atrybutów, których należy szukać:
- Reallocated_Sector_Ct: Wskazuje liczbę złych sektorów, które zostały przemapowane.
- Current_Pending_Sector: Liczba niestabilnych sektorów oczekujących na przemapowanie.
- Temperature_Celsius: Bieżąca temperatura dysku.
Interpretacja tych atrybutów może zapewnić wgląd w bieżący stan dysku.
4. Przeprowadzanie krótkiego autotestu
smartctl umożliwia uruchamianie autotestów bezpośrednio na dysku w celu sprawdzenia potencjalnych problemów. Krótki test to szybka diagnostyka, którą można wykonać za pomocą następującego polecenia:
sudo smartctl -t short /dev/sdX
Ten test trwa kilka minut i sprawdza podstawowe błędy odczytu. Po zakończeniu testu można wyświetlić wyniki za pomocą:
sudo smartctl -l selftest /dev/sdX
5. Uruchamianie długiego autotestu
W celu dokładniejszego sprawdzenia dysku można przeprowadzić długi autotest:
sudo smartctl -t long /dev/sdX
Długi test przeprowadza bardziej kompleksową analizę powierzchni dysku, ale jego ukończenie może zająć kilka godzin, w zależności od rozmiaru i prędkości dysku. Sprawdź status trwającego testu za pomocą:
sudo smartctl -c /dev/sdX
6. Włączanie lub wyłączanie SMART
SMART jest zazwyczaj domyślnie włączony na większości dysków, ale w rzadkich przypadkach może być wyłączony. Aby włączyć SMART na dysku, uruchom:
sudo smartctl -s on /dev/sdX
Aby go wyłączyć, użyj:
sudo smartctl -s off /dev/sdX
Włączenie SMART jest zalecane, ponieważ pozwala na wykorzystanie wszystkich możliwości monitorowania smartctl.
Interpretacja danych SMART
Atrybuty SMART zgłaszane przez
smartctl
- Raw_Read_Error_Rate: Wysokie wartości mogą wskazywać na problemy ze zdolnością dysku do dokładnego odczytu danych.
- Reallocated_Sector_Ct: Niezerowa wartość może oznaczać, że na dysku zaczynają pojawiać się uszkodzone sektory. Jeśli liczba ta nadal rośnie, może to oznaczać awarię dysku.
- Power_On_Hours: Całkowita liczba godzin, przez które dysk był włączony. Może to dać wyobrażenie o wieku dysku.
- Temperature_Celsius: Wysokie temperatury (powyżej 60°C) mogą skrócić żywotność dysku. Najlepiej jest utrzymywać temperaturę w zakresie 30-40°C.
Automatyczne monitorowanie stanu SMART
Aby śledzić stan dysku w czasie, można skonfigurować smartd, działającego w tle demona dołączonego do smartmontools. Może on automatycznie uruchamiać testy i powiadamiać za pośrednictwem poczty e-mail, jeśli dysk zacznie wykazywać oznaki awarii.
Należy edytować plik konfiguracyjny znajdujący się pod adresem /etc/smartd.conf, aby określić, które dyski mają być monitorowane i jak często powinny być uruchamiane testy. Następnie można włączyć i uruchomić usługę smartd za pomocą:
sudo systemctl enable smartd
sudo systemctl start smartd
Wniosek
smartctl to potężne narzędzie do monitorowania i utrzymywania kondycji urządzeń pamięci masowej w systemie Linux. Korzystając z poleceń opisanych w tym przewodniku, można proaktywnie sprawdzać dyski pod kątem potencjalnych problemów, przeprowadzać testy diagnostyczne i analizować szczegółowe dane SMART. Regularne korzystanie z narzędzia smartctl może pomóc w zapobieganiu utracie danych poprzez wczesną identyfikację uszkodzonych dysków, dając czas na utworzenie kopii zapasowej ważnych danych i wymianę wadliwego sprzętu.
Dzięki smartctl zyskujesz cenny wgląd w kondycję swoich dysków, zapewniając długowieczność i niezawodność infrastruktury pamięci masowej w systemie Linux.