bolug bonner linux user group
news about wissen files archive hilfe suchen  

 

archive :: BoLUG

druckfassung

BoLUG

Re: laufend Stabilitätsprobleme

To: bolug@xxxxxxxxxxx
Subject: Re: laufend Stabilitätsprobleme
From: Jörg Prante <joergprante@xxxxxxxxxxxxx>
Date: Sat, 22 Jan 2005 13:27:38 +0100
Am Samstag, 22. Januar 2005 07:49 schrieb Aldo Valente:
> Beim Dell hatte ich Meldungen auf der Konsole, die davon sprachen das
> er nicht auf ein offline Device schreiben kann.  Das kam manchmal
> schleichend, zuerst ging schreiben nicht, dann versagte er beim lesen
> von immer mehr Dateien.

Welcher Treiber? aacraid? megaraid? megeraid2?
Wenn aacraid -> ab in die Tonne.

https://bugzilla.redhat.com/bugzilla/show_bug.cgi?id=92129

Wenn Meldung "rejecting I/O to offline device": das ist nur ein Folgefehler. 
Vermutlich verursacht von einer kaputten Platte oder einem Host adapter reset 
auf dem SCSI bus.  Was sein könnte, wenn nicht die Platte abgeschmiert ist: 
Cache-Kohärenz im Eimer, ein Problem mit alten BIOSen und neuen Linuxkernel. 
Mein Vorschlag wäre in dem Fall, das neueste BIOS von Dell auf den 
RAID-Controller aufzuspielen. Im Zweifelsfall immer Dell-Support anrufen - 
erste Frage dort ist immer, haben Sie die aktuelle Firmware.

>Die unterschiedlichste, wie ich schon schrieb.

Was erwartest Du also an Antwort? Wenn ich die Hardwarebezeichnungen nicht 
weiss, kann es auch keine weiteren Hinweise geben.

>Allerdings hat das RAID0 aus zwei S-ATA Platten
>100MB/s mit hdparm geliefert. 

Mit welcher CPU-Last? Effektiv ist ein SATA Systemdurchsatz nur 40% eines 
SCSI-Systems. hdparm ist kein Durchsatzprüfer für das ganze System.

>Welcher von den PERC Dingern drin ist, habe ich nicht im Kopf.
>Übrigens wurde MoBo und Raid Controller schon ausgetauscht.  Bei den
>schmalen Dingern mag ich auch gar nicht glauben, das die thermisch
>völlig OK sind.

Kommt auf das Gebläse im Gehäuse an.

>Andersrum, wer hat denn ähnliche I/O Lasten und kann mir gute Hardware
>empfehlen?

Ich habe hier folgende Indexierungsmaschine,  20 SCSI-Platten mit einem Dell 
Poweredge 6650 und vier Arrays an zwei PERC 3/DC Controllern (3x RAID5, 1x 
RAID1).

Linux leto 2.4.21-20.ELhugemem #1 SMP Thu Sep 16 13:49:17 EDT 2004 i686 i686 
i386 GNU/Linux

05:00.0 RAID bus controller: American Megatrends Inc. MegaRAID (rev 20)
        Subsystem: Dell Computer Corporation PowerEdge RAID Controller 3/DC
        Flags: bus master, medium devsel, latency 32, IRQ 21
        Memory at f0000000 (32-bit, prefetchable) [size=128M]
        Expansion ROM at fcf00000 [disabled] [size=32K]
        Capabilities: <available only to root>

12:00.0 RAID bus controller: American Megatrends Inc. MegaRAID (rev 20)
        Subsystem: Dell Computer Corporation PowerEdge RAID Controller 3/DC
        Flags: bus master, medium devsel, latency 32, IRQ 23
        Memory at e0000000 (32-bit, prefetchable) [size=128M]
        Expansion ROM at ee800000 [disabled] [size=128K]
        Capabilities: <available only to root>

megaraid: v1.18k (Release Date: Thu Aug 28 10:05:11 EDT 2003)
megaraid: found 0x101e:0x1960:idx 0:bus 5:slot 0:func 0
scsi1 : Found a MegaRAID controller at 0xd286f000, IRQ: 21
scsi1 : Enabling 64 bit support
megaraid: [1.78:3.29] detected 2 logical drives
megaraid: supports extended CDBs.
megaraid: channel[1] is raid.
megaraid: channel[2] is raid.
megaraid: found 0x101e:0x1960:idx 1:bus 18:slot 0:func 0
scsi2 : Found a MegaRAID controller at 0xd2871000, IRQ: 23
scsi2 : Enabling 64 bit support
megaraid: [1.92:3.31] detected 2 logical drives
megaraid: supports extended CDBs.
megaraid: channel[1] is raid.
megaraid: channel[2] is raid.
scsi1 : LSI Logic MegaRAID 1.78 254 commands 15 targs 5 chans 7 luns
scsi2 : LSI Logic MegaRAID 1.92 254 commands 15 targs 5 chans 7 luns

/etc/sysctl.conf:
vm.min-readahead = 31
vm.max-readahead = 127

https://bugzilla.redhat.com/bugzilla/show_bug.cgi?id=106771

Genaue Lastdaten muss ich aus vmstat Läufen nachts ermitteln, wenn die Hölle 
auf der Maschine losbricht.

Jörg

-- 
Jörg Prante
joergprante@xxxxxxxxxxxxx

"Really, I'm not out to destroy Microsoft. That will just be a 
completely unintentional side effect." (Linus Torvalds)

 

seitenanfang


 

news about wissen files archive hilfe suchen  
kontakt letzte änderung: 22.01.2005