Hardwarefehler auf einem dedizierten Server im Rescue-Modus diagnostizieren

Ziel

Mit der Zeit kann es bei Ihrem Server zu Hardwarefehlern kommen, die Fehlfunktionen verursachen. Wenn der Server im OVHcloud Rescue-Modus gestartet ist, stehen Ihnen mehrere Diagnosetools zur Verfügung, um fehlerhafte Hardwarekomponenten zu identifizieren.

Diese Anleitung erklärt, wie Sie Hardwarefehler auf Ihrem OVHcloud Dedicated Server erkennen.

Voraussetzungen

In der praktischen Anwendung

In dieser Anleitung werden Tests zur Diagnose der folgenden Komponenten aufgeführt:

  • Prozessor
  • Netzwerkverbindung
  • RAM
  • Partitionen und Disks

Prozessoren

Der Prozessortest überprüft, ob der Prozessor Ihres Servers korrekt funktioniert und benötigt etwa 30 Minuten. Wenn der Server während des Tests abstürzt, ist der Prozessor beschädigt.

WRKR=$(grep -c "^processor" /proc/cpuinfo)
stress-ng --metrics-brief --timeout 60s --cpu $WRKR --io $WRKR --aggressive --ignite-cpu --maximize --pathological
stress-ng --metrics-brief --timeout 60s --brk 0 --stack 0 --bigheap

Netzwerkverbindung

Der Netzwerktest überprüft Ihre interne und externe Bandbreite. Diese Daten dienen als Anhaltspunkt; es handelt sich nicht um einen Leistungstest.

ping -c 10 proof.ovh.net
for file in 1Mb 10Mb 100Mb 1Gb ; do time curl -4f https://proof.ovh.net/files/${file}.dat -o /dev/null; done

RAM

Der Arbeitsspeichertest überprüft alle RAM-Module Ihres Servers. Wenn der Server während des Tests abstürzt, ist mindestens ein RAM-Modul beschädigt.

Warning

Achtung, dieser Test kann sehr lange dauern.

RAM="$(awk -vOFMT=%.0f '$1 == "MemAvailable:" {print $2/1024 - 1024}' /proc/meminfo)"
memtester ${RAM}M 1

Disk Health

Sie können Smartmontools verwenden, um den Status Ihrer Disks zu überprüfen, indem Sie deren SMART-Daten auslesen. Um beispielsweise alle Details der Disk mit dem Namen nvme1n1 anzuzeigen, geben Sie Folgendes ein:

smartctl -a /dev/nvme1n1

Weitere Informationen zur Ausgabe dieses Befehls und deren Interpretation finden Sie in der offiziellen Dokumentation zu Smartmontools.

Disk-Partitionen

Der Partitionstest umfasst einen Zugriffstest auf die Disk und eine Prüfung des Dateisystems. Der Zugriffstest prüft, ob das System mit den Disks Ihres Server kommunizieren kann. Die Überprüfung des Dateisystems führt den Befehl fsck -fy aus.

Führen Sie den folgenden Befehl aus, um das Dateisystem zu überprüfen:

fsck -fy

Führen Sie den folgenden Befehl aus, um einen Read-Test durchzuführen. Ersetzen Sie sd(x) durch eigene Werte.

hdparm -t /dev/sd(x)

Weiterführende Informationen

Für den Austausch mit unserer User Community.

War diese Seite hilfreich?