Linux 14.982 Themen, 106.349 Beiträge

sata-Festplatte friert ein

Borowitsch / 20 Antworten / Flachansicht Nickles

Hallo Linuxer,

ich habe grade ein Problem, und keine Ahnung wo es herkommt:

System: AMD64X2, 4GB RAM, NVIDIA Chipsatz, 2 SATA-Platten (80-GB ExcelStore und 160 GB SAMSUNG)
BS ist Debian Lenny, Kernel 2.6.26-1-amd64

Seit ca. zwei Wochen friert der Rechner zeitweise ein, nach ca. 1 bis 2 Minuten läuft dann wieder alles, nach einem Spindown und Spinup der 80 GB - Platte. Der Fehler tritt unregelmässig auf, bei verschiedenen Anwendungen, und ist nicht reproduzierbar.

Das Intervall zwischen zwei solchen "Stehern" ist zwischen 30 Minuten und 6 Stunden. Ich habe mich im Netz schlau gemacht und beide Platten mit "badblocks" und den SMART-Tests sowie mit e2fscheck und Reiserfscheck überprüft, keine Fehler.
Test-Tools der beiden Hersteller ergaben ebenfalls keine Fehler.

kern.log sieht so aus:

Dec 1 10:06:25 Donald kernel: [ 4788.255283] ata1: EH in SWNCQ mode,QC:qc_active 0x7 sactive 0x7
Dec 1 10:06:25 Donald kernel: [ 4788.255290] ata1: SWNCQ:qc_active 0x3 defer_bits 0x4 last_issue_tag 0x1
Dec 1 10:06:25 Donald kernel: [ 4788.255291] dhfis 0x3 dmafis 0x0 sdbfis 0x0
Dec 1 10:06:25 Donald kernel: [ 4788.255294] ata1: ATA_REG 0x50 ERR_REG 0x0
Dec 1 10:06:25 Donald kernel: [ 4788.255296] ata1: tag : dhfis dmafis sdbfis sacitve
Dec 1 10:06:25 Donald kernel: [ 4788.255298] ata1: tag 0x0: 1 0 0 1
Dec 1 10:06:25 Donald kernel: [ 4788.255300] ata1: tag 0x1: 1 0 0 1
Dec 1 10:06:25 Donald kernel: [ 4788.255309] ata1.00: exception Emask 0x0 SAct 0x7 SErr 0x0 action 0x6 frozen
Dec 1 10:06:25 Donald kernel: [ 4788.255315] ata1.00: cmd 61/e8:00:6d:f1:7f/02:00:03:00:00/40 tag 0 ncq 380928 out
Dec 1 10:06:25 Donald kernel: [ 4788.255316] res 40/00:01:01:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255319] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255324] ata1.00: cmd 61/68:08:5d:f4:7f/00:00:03:00:00/40 tag 1 ncq 53248 out
Dec 1 10:06:25 Donald kernel: [ 4788.255325] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255327] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255332] ata1.00: cmd 60/20:10:af:1a:4f/00:00:08:00:00/40 tag 2 ncq 16384 in
Dec 1 10:06:25 Donald kernel: [ 4788.255333] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255335] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255341] ata1: hard resetting link
Dec 1 10:06:26 Donald kernel: [ 4788.835296] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
Dec 1 10:06:26 Donald kernel: [ 4788.866416] ata1.00: configured for UDMA/133
Dec 1 10:06:26 Donald kernel: [ 4788.866436] ata1: EH complete
Dec 1 10:06:26 Donald kernel: [ 4788.866546] sd 0:0:0:0: [sda] 160836480 512-byte hardware sectors (82348 MB)
Dec 1 10:06:26 Donald kernel: [ 4788.866565] sd 0:0:0:0: [sda] Write Protect is off
Dec 1 10:06:26 Donald kernel: [ 4788.866568] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
Dec 1 10:06:26 Donald kernel: [ 4788.866599] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA

Ich bin jedenfalls mit meinem Latein am Ende, ich hoffe es kann jemand helfen.

Danke im Voraus

Borowitsch
-

The trouble with computers is that they do what you told them - not what you wanted them to do.
bei Antwort benachrichtigen
KarstenW Borowitsch „Hallo Karsten, danke für die schnelle Antwort. Ich habe ein 64bits System ohne...“
Optionen

Dann weiß ich auch nicht weiter. Debian lenny ist momentan testing,also eine Betaversion von Debian. Da können schon noch Programmierfehler enthalten sein.
In solchen Fällen übersetze ich mir meinen eigenen Kernel und deaktivieren alle unnötigen Treiber. Das hat schon früher bei SUSE geholfen und auch bei Debian gab es mit dem Standkernel gelegentlich Probleme.
Ich weiß nicht woran das liegt. Ich nehme mal an das manche Treiber von schlechter Qualität sind und wenn diese Treiber mit geladen werden (obwohl sie gar nicht gebraucht werden) , dann gibt es Probleme.
Also ich übersetze in solchen Fällen einfach mal einen eigene Kernel und deaktiviere alle unnötigen Treiber (für die es im Rechner gar keine Hardware gibt):

Vielleicht hilft dir diese Wiki von gentoo:

http://de.gentoo-wiki.com/wiki/Kernel_manuell_kompilieren

Also die Treiber von NVidia sind bestimmt gute Treiber, aber im Standardkernel sind zu viele nutzlose Treiber die gar nicht gebraucht werden. Und wenn dann ein Treiber nicht so gut programmiert ist, kann es Probleme geben.

PS: Auf die RAM Disk kannst du verzichten, weil du selbst entscheiden kannst welche Treiber monolitisch und welche modular übersetzt werden müssen

PPS: Auf dieser Seite habe ich schon wertvolle Hinweise gefunden (ich bin kein Systemprogrammierer):

http://kernelnewbies.org/


Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen
Plattentemperatur Borowitsch