Linux 15.070 Themen, 107.540 Beiträge

data parity error detected during address or write data phase

Firebolt / 7 Antworten / Baumansicht Nickles

Hoila,

ich habe folgendes:

pci error interrupt at aeqaddr = 0x9
data parity error detected during address or write data phase

Dieser Fehler taucht immer dann auf, wenn ich die 2. Netzwerkkarte eingebunden habe.

Im Netz gibt es keine Antworten auf das Problem, der Witz ist, dass dies schon bei 2 anderen Rechner ebenfalls passierte, die auch 2 Netzwerkkarten hatten. Also liegt es weniger an der Hardware.

Selbst verschiedene Distributionen habe ich probiert. RedHat 7.2, Suse 8.1 und Debian 3.1. Überall kommt der selbe Fehler.


cat /proc/interrupts
CPU0
0: 394533 XT-PIC timer
1: 1189 XT-PIC keyboard
2: 0 XT-PIC cascade
8: 4 XT-PIC rtc
9: 72817 XT-PIC aic7xxx, usb-uhci
10: 185 XT-PIC eth1
11: 13251 XT-PIC eth0
NMI: 0
LOC: 394481
ERR: 0
MIS: 0
--------------------------------------------------------
cat /proc/interrupts
CPU0
0: 394533 XT-PIC timer
1: 1189 XT-PIC keyboard
2: 0 XT-PIC cascade
8: 4 XT-PIC rtc
9: 72817 XT-PIC aic7xxx, usb-uhci
10: 185 XT-PIC eth1
11: 13251 XT-PIC eth0
NMI: 0
LOC: 394481
ERR: 0
MIS: 0
fileserver:~#
fileserver:~# cat /proc/ioports
0000-001f : dma1
0020-003f : pic1
0040-005f : timer
0060-006f : keyboard
0070-007f : rtc
0080-008f : dma page reg
00a0-00bf : pic2
00c0-00df : dma2
00f0-00ff : fpu
02f8-02ff : serial(set)
03c0-03df : vga+
03f8-03ff : serial(set)
0cf8-0cff : PCI conf1
b400-b4ff : Realtek Semiconductor Co., Ltd. RTL-8139
b400-b4ff : 8139too
b800-b8ff : Davicom Semiconductor, Inc. Ethernet 100/10 MBit
b800-b8ff : dmfe
d000-d0ff : Adaptec AHA-2940U2/W / 7890
d000-d0ff : aic7xxx
d400-d41f : Intel Corp. 82371AB PIIX4 USB
d400-d41f : usb-uhci
d800-d80f : Intel Corp. 82371AB PIIX4 IDE
d800-d807 : ide0
d808-d80f : ide1
e400-e43f : Intel Corp. 82371AB PIIX4 ACPI
e800-e81f : Intel Corp. 82371AB PIIX4 ACPI
--------------------------------------------------------

Falls noch was an Infos fehlt kurz fragen. Dank im voraus für die Hilfe. Ich habe aufgegeben das Problem selbst zu lösen nachdem ich so oft neuinstalliert habe. Wie schon erwähnt habe ich die Vermutung eines Treiberkonflikts des AIC7xxx, aber was es genau ist keine Ahnung.

Ciao
Firebolt

Rechtschreibkorrekturfarm ! LoeLio
bei Antwort benachrichtigen
Firebolt Nachtrag zu: „data parity error detected during address or write data phase“
Optionen

Nachtrag:

cat /proc/pci
PCI devices found:
Bus 0, device 0, function 0:
Host bridge: Intel Corp. 440BX/ZX - 82443BX/ZX Host bridge (rev 2).
Master Capable. Latency=64.
Prefetchable 32 bit memory at 0xe4000000 [0xe7ffffff].
Bus 0, device 1, function 0:
PCI bridge: Intel Corp. 440BX/ZX - 82443BX/ZX AGP bridge (rev 2).
Master Capable. Latency=64. Min Gnt=136.
Bus 0, device 4, function 0:
ISA bridge: Intel Corp. 82371AB PIIX4 ISA (rev 2).
Bus 0, device 4, function 1:
IDE interface: Intel Corp. 82371AB PIIX4 IDE (rev 1).
Master Capable. Latency=32.
I/O at 0xd800 [0xd80f].
Bus 0, device 4, function 2:
USB Controller: Intel Corp. 82371AB PIIX4 USB (rev 1).
IRQ 9.
Master Capable. Latency=32.
I/O at 0xd400 [0xd41f].
Bus 0, device 4, function 3:
Bridge: Intel Corp. 82371AB PIIX4 ACPI (rev 2).
IRQ 9.
Bus 0, device 6, function 0:
SCSI storage controller: Adaptec AHA-2940U2/W / 7890 (rev 0).
IRQ 9.
Master Capable. Latency=32. Min Gnt=39.Max Lat=25.
I/O at 0xd000 [0xd0ff].
Non-prefetchable 64 bit memory at 0xd5800000 [0xd5800fff].
Bus 0, device 11, function 0:
Ethernet controller: Davicom Semiconductor, Inc. Ethernet 100/10 MBit (rev 49).
IRQ 10.
Master Capable. Latency=32. Min Gnt=20.Max Lat=40.
I/O at 0xb800 [0xb8ff].
Non-prefetchable 32 bit memory at 0xd5000000 [0xd50000ff].
Bus 0, device 12, function 0:
Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139 (rev 16).
IRQ 11.
Master Capable. Latency=32. Min Gnt=32.Max Lat=64.
I/O at 0xb400 [0xb4ff].
Non-prefetchable 32 bit memory at 0xd4800000 [0xd48000ff].
Bus 1, device 0, function 0:
VGA compatible controller: nVidia Corporation NV11 (GeForce2 MX) (rev 161).
IRQ 11.
Master Capable. Latency=64. Min Gnt=5.Max Lat=1.
Non-prefetchable 32 bit memory at 0xd6000000 [0xd6ffffff].
Prefetchable 32 bit memory at 0xd8000000 [0xdfffffff].

Rechtschreibkorrekturfarm ! LoeLio
bei Antwort benachrichtigen
KarstenW Firebolt „Nachtrag: cat /proc/pci PCI devices found: Bus 0, device 0, function 0: Host...“
Optionen

Ich würde mal, um Hardwarefehler auszuschließen, jede Netzwerkkarte einzeln in den Rechner einbauen , und testen ob die jeweilige Netzwerkkarte o.K. ist.

Dann würde ich auch mal nach schauen ob überhaupt passende Treiber zur Verfügung stehen.
Für die "b400-b4ff : Realtek Semiconductor Co., Ltd. RTL-8139 "- Netzwerkkarte gibt es auf jeden Fall einen guten Treiber (er wird als "rtl8139" bezeichnet).
Nur die "b800-b8ff : Davicom Semiconductor, Inc. Ethernet 100/10 MBit " - Netzwerkkarte kenne ich nicht.
Welcher Chipsatz ist auf diese Netzwerkkarte aufgelötet (Bezeichnung steht immer auf dem Chip oben drauf) ?
Die Treiber heißen meistens so, wie die Chipsätze auf den Platinen bezeichnet werden.
Man braucht für jeden Chipsatz in der Regel einen speziellen Treiber , welcher dann den Chip steuert muß (und das bei dem Chaos der Hardwareausstattung).


Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen
KarstenW Nachtrag zu: „Ich würde mal, um Hardwarefehler auszuschließen, jede Netzwerkkarte einzeln in...“
Optionen

Da die Treiber im Kern laufen, ist immer die Kernelversion entscheidend für die Hardwareunterstützung. Ich schaue meistens erstmal bei den Kernelsourcen rein und konfiguriere mir einen eigenen Kern, um herauszufinden ob ein passender Treiber zur Verfügung steht.

Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen
Firebolt KarstenW „Da die Treiber im Kern laufen, ist immer die Kernelversion entscheidend für die...“
Optionen

Hoila KarstenW,

danke für die schnelle Antwort, aber so sehe ich das nicht, denn die anderen Rechner hatten derweil das selbe Problem. z. B. war bei dem Einen ein Promise-Controller vorhanden der zwei IDE-Platten angeschlossen hatte und zwei RTL-Karten. Sobald die 2. aktiv war, kam dieser Fehler.
Auch schon mit einer Intel eepro100 ausprobiert. Der gleiche Effekt.

rtl8139 Treiber ist schon im Kernel 2.4.
"dmfe" ist der Treiber für 9102 AF Davicom. Manuell installiert per modconf.

Das mit den einzelnem Test habe ich schon durchgeführt sowie die PCI-Steckplätze getauscht.
1) Einzeln, einwandfrei.
2) Und der Tausch funktionierte auch nur wenn sie nicht beide aktiv waren.


Wie man aus der Datei ersehen kann gibt es auch kein Sharing Prob.

Ich bin da echt ratlos, das Einzige was ich noch nicht getan habe ist den Kernel neu zu kompilieren. Muss ich ehrlich gestehen, habe ich das letzte Mal vor 3 Jahren gemacht und damals hatte es nicht so wirklich geklappt.

Also werde ich mal versuchen die Netzwerkkarten Treiber sowie die SCSI-Treiber zu erneuern. Vielleicht ist das ein Konflikt. Melde mich wieder.

Ciao
Firebolt

Rechtschreibkorrekturfarm ! LoeLio
bei Antwort benachrichtigen
KarstenW Firebolt „Hoila KarstenW, danke für die schnelle Antwort, aber so sehe ich das nicht,...“
Optionen

Kernelneukompilierung ist nur eine Lösung, wenn sich irgendwelche Kerneloption mit deiner Hardware nicht vertragen. Die Standardkernel sind halt überfüllt mit nutzlosen Treibern.

Vielleicht ist es doch ein IRQ Sharing Problem. IRQ 11 wird auch vom Promise-Controller verwendet, glaub ich. IRQ Sharing muß auch vom Gerätetreiber unterstützt werden. Vielleicht mal den Promise im BIOS deaktivieren.
Wenn es ein IRQ Problem sein sollte und du hast so einen modernen APIC , welcher 24 IRQ verwalten kann, dann kannst du ja im Betriebsystemkern APIC aktivieren. Du hast dann eventuell statt 16 IRQs 24 IRQ Kanäle (ein kleiner Artikel):

http://www.hardtecs4u.com/reviews/2002/irq/index4.php

APIC muß aber deine Platine unterstützen.

Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen
Firebolt KarstenW „Kernelneukompilierung ist nur eine Lösung, wenn sich irgendwelche Kerneloption...“
Optionen

Ja danke, den Artikel kenne ich schon in Bezug auf andere Dinge.

Es ist ein Ausu P2B-S SCSI U2W-Ultra onboard, kein APIC. Der Promise ist eine TX2-Karte und PCI. Wie schon erwähnt kommt das Problem ja nur zu stande, wenn die zweite Netzwerkkarte aktiviert wird. Ich sehe da wirklich keinen Zusammenhang mit IRQ-Probs. Leider gibt es immer wieder Dinge, die nicht offensichtlich sind. Und wie erwähnt habe ich schon das Netz durchsucht, weltweit, kaum Infos und wenn, dann nie beantwortet.

Da diese Hardware schon recht weitverbreitet war zu der Zeit, dachte ich das jemand sich noch an das Problem erinnert, aber vielleicht hat auch niemand 2 Netzwerkkarten betrieben.

Nun ist meine Lösung erstmal zu versuchen einen anderen IRQ für den Promise zu bekommen und eventuell für die Netzwerkkarte, da auch das Umstecken nichts brachte.
Genug IRQs sind ja frei.

Ciao
Firebolt

Rechtschreibkorrekturfarm ! LoeLio
bei Antwort benachrichtigen
KarstenW Firebolt „Ja danke, den Artikel kenne ich schon in Bezug auf andere Dinge. Es ist ein Ausu...“
Optionen

Es kann aber auch daran liegen, das sich eventuell irgendwelche Signalpegel der einzelnen Netzwerkkarten nicht vertragen. Vielleicht einfach mal die gleichen Netzwerkkarten in den Rechner einbauen. Normalerweise sind diese Pegel standardisiert, aber irgendwelche Hersteller denken manchmal, sie müßten irgendwas eigenes herstellen.
Beispielsweise gab es ja schon immer Pronleme mit dem IDE-Treiber im Betriebsystemkern. Der Entwickler für den IDE-Treiber muß ständig irgendwelche Spezialfälle berücksichtigen, weil sich manche Hersteller nicht an die Standards halten. Die Anwender wundern sich dann immer warum es Probleme mit ihrem Motherboard gibt, wo doch angeblich alle Komponenten unterstützt werden würden.
Unixrechner sind da irgendwie besser, aber auch sa* teuer.

Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen