Linux 14.986 Themen, 106.422 Beiträge

sata-Festplatte friert ein

Borowitsch / 20 Antworten / Flachansicht Nickles

Hallo Linuxer,

ich habe grade ein Problem, und keine Ahnung wo es herkommt:

System: AMD64X2, 4GB RAM, NVIDIA Chipsatz, 2 SATA-Platten (80-GB ExcelStore und 160 GB SAMSUNG)
BS ist Debian Lenny, Kernel 2.6.26-1-amd64

Seit ca. zwei Wochen friert der Rechner zeitweise ein, nach ca. 1 bis 2 Minuten läuft dann wieder alles, nach einem Spindown und Spinup der 80 GB - Platte. Der Fehler tritt unregelmässig auf, bei verschiedenen Anwendungen, und ist nicht reproduzierbar.

Das Intervall zwischen zwei solchen "Stehern" ist zwischen 30 Minuten und 6 Stunden. Ich habe mich im Netz schlau gemacht und beide Platten mit "badblocks" und den SMART-Tests sowie mit e2fscheck und Reiserfscheck überprüft, keine Fehler.
Test-Tools der beiden Hersteller ergaben ebenfalls keine Fehler.

kern.log sieht so aus:

Dec 1 10:06:25 Donald kernel: [ 4788.255283] ata1: EH in SWNCQ mode,QC:qc_active 0x7 sactive 0x7
Dec 1 10:06:25 Donald kernel: [ 4788.255290] ata1: SWNCQ:qc_active 0x3 defer_bits 0x4 last_issue_tag 0x1
Dec 1 10:06:25 Donald kernel: [ 4788.255291] dhfis 0x3 dmafis 0x0 sdbfis 0x0
Dec 1 10:06:25 Donald kernel: [ 4788.255294] ata1: ATA_REG 0x50 ERR_REG 0x0
Dec 1 10:06:25 Donald kernel: [ 4788.255296] ata1: tag : dhfis dmafis sdbfis sacitve
Dec 1 10:06:25 Donald kernel: [ 4788.255298] ata1: tag 0x0: 1 0 0 1
Dec 1 10:06:25 Donald kernel: [ 4788.255300] ata1: tag 0x1: 1 0 0 1
Dec 1 10:06:25 Donald kernel: [ 4788.255309] ata1.00: exception Emask 0x0 SAct 0x7 SErr 0x0 action 0x6 frozen
Dec 1 10:06:25 Donald kernel: [ 4788.255315] ata1.00: cmd 61/e8:00:6d:f1:7f/02:00:03:00:00/40 tag 0 ncq 380928 out
Dec 1 10:06:25 Donald kernel: [ 4788.255316] res 40/00:01:01:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255319] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255324] ata1.00: cmd 61/68:08:5d:f4:7f/00:00:03:00:00/40 tag 1 ncq 53248 out
Dec 1 10:06:25 Donald kernel: [ 4788.255325] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255327] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255332] ata1.00: cmd 60/20:10:af:1a:4f/00:00:08:00:00/40 tag 2 ncq 16384 in
Dec 1 10:06:25 Donald kernel: [ 4788.255333] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255335] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255341] ata1: hard resetting link
Dec 1 10:06:26 Donald kernel: [ 4788.835296] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
Dec 1 10:06:26 Donald kernel: [ 4788.866416] ata1.00: configured for UDMA/133
Dec 1 10:06:26 Donald kernel: [ 4788.866436] ata1: EH complete
Dec 1 10:06:26 Donald kernel: [ 4788.866546] sd 0:0:0:0: [sda] 160836480 512-byte hardware sectors (82348 MB)
Dec 1 10:06:26 Donald kernel: [ 4788.866565] sd 0:0:0:0: [sda] Write Protect is off
Dec 1 10:06:26 Donald kernel: [ 4788.866568] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
Dec 1 10:06:26 Donald kernel: [ 4788.866599] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA

Ich bin jedenfalls mit meinem Latein am Ende, ich hoffe es kann jemand helfen.

Danke im Voraus

Borowitsch
-

The trouble with computers is that they do what you told them - not what you wanted them to do.
bei Antwort benachrichtigen
Borowitsch KarstenW „Vielleicht das Board defekt ? Mir ist mein Gigabyte Board kaputt gegangen,...“
Optionen

Hallo Karsten,
seltsamer Zufall, meins ist auch ein Gigabyte.

Ich glaube aber nicht dass das Board hinüber ist, sowohl Memtest als auch CPU-Tests sind fehlerfrei durchgelaufen, und bisher hat bei einem defekten Board zumindest der Memtest immer gezickt. Die onboard-NVIDIA-Grafik hat auch bestanden.

Netzteil müsste auch OK sein, ich habs an einen Belastungstester gehängt, alle Werte in der Norm.

Ich weiß nicht mehr weiter, seltsamer Fehler :-(

Die Aussetzer kommen mit dem Standard- und mit meinem Eigenbaukernel, in beiden Fällen unregelmässig und nicht reproduzierbar. Ich habe jetzt mal alle Kabelverbindungen gelöst und mit Elektronikkontakt behandelt, mal sehen, ev. wars das.

Borowitsch
-

The trouble with computers is that they do what you told them - not what you wanted them to do.
bei Antwort benachrichtigen
Plattentemperatur Borowitsch