• 28.04.2024, 00:06
  • Registrieren
  • Anmelden
  • Sie sind nicht angemeldet.

 

Lieber Besucher, herzlich willkommen bei: Aqua Computer Forum. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

INTEL-RAID PROBLEM, SBS2000 SuperMicro MB -gelöst-

Montag, 20. August 2007, 00:35

hallo liebes forum,

ich habe hier massive probleme mit einem server, genauer mit dem raid-system. da hier ja einige leute mit guter it-erfahrung sind, und ich mich erinnere, daß tom ähnliche server laufen hat, hoffe ich auf gute ideen. ich schlage mich schon mehrere wochen mit dem mist herum...

kurzer abriß:
...................................................................
SERVER: Instabilitäten im RAID-Betrieb.

HARDWARE:
Barebone 771 N-Tec (SuperMicro X7DBE Rev. 1.b):
mit Dual XEON 5150 2.66/1066/4MB und
4 * 1024 MB DDR2 FBDIMM PC667 ECC CL5 RAM
4 * HDD SATA2 WD 160GB WD1600YS 16MB Raid
Adaptec 29160 SCSI-Controller
Streamer Quantum DLT VS160
NT 3*350 Watt redundant.

SOFTWARE:
WINDOWS 2000 SBS (Build 2195) SP4 incl. aktueller Updates
Alle Grätetreiber nur von der mitgelieferten N-Tec CD (um Inkompoatibilitäten mit bestehenden BIOS-Versionen zu vermeiden)

KONFIGURATION:
RAID-Controller: BIOS Version 5.6.2.1002 ESB im INTEL-Modus (nicht Adaptec),
2 * Raid 1 ("SYSTEM-HDDs" an 0 und 1, "DATEN-HDDs" an 2 und 3, 4 und 5 nicht benutzt.)


FEHLERBILDER DES RAID-SYSTEMS:
1: Gelegentliches Auftreten (außerhalb der Backup-Zeit) des Fehlers: "Das Gerät ... IASTOR ... hat innerhalb der Fehlerwartezeit nicht geantwortet." im Ereignisprotokoll. Während des DLT-Backups häufigeres Auftreten (alle 2-3 Tage).

2: In den letzten 4 Wochen hat das Raidsystem (DATEN) 2 Mal eine Festplatte "verloren", d.h. "kein Gerät angeschlossen".
Nach Neustart des Servers wurden die Platten (1*Anschluß 2, 1*Anschluß 3 des Daten-RAIDs) dann von selbst wiedergefunden, Daten-RAID hat sich selbstständig wiederhergestellt.

3. Während des Backups hat sich der Server in den letzten 10 Tagen 3 Mal komplett aufgehangen (Hardreset nötig!!!).


FEHLERSUCHE:
1. Der Fehler trat auch auf, wenn im Backup (als Test) "Sicherung in Datei" gewählt wurde. (Ob mit oder ohne vorhandenen SCSI-Adapter spielte dabei keine Rolle.) Bandlaufwerk ist also als Ursache auszuschließen.

2. Der Fehler BLIEB AUS, wenn mit 2 HDDs (ohne HDD-Redundanz) getestet wurde (1*SYSTEM-HDD, 1*DATEN-HDD)
3. Der Fehler BLIEB AUS, wenn mit 3 HDDs (ohne SYSTEM-Redundanz) getestet wurde (1*SYSTEM-HDD, 2*DATEN-HDD im RAID)

Getestet wurden jeweils Datensicherung (ca. 27 GB)
a) auf Band,
b) in Datei auf Systemplatte,
c) in Datei auf Datenplatte / bzw. DatenRAID,
wobei c) natürlich die maximale Belastung des Gesamtsystems darstellt.
...................................................................

Im Moment läuft alles Stabil, allerdings mit nur 3 Platten:


sobald ich die 2.systemplatte ins raid wieder einfüge und sich das systemraid wiederherstellt, tauchen die iastor-fehler wieder auf. das will ich im moment nicht riskieren, nach dem letzten nötigen hard-reset (gottseidank an einem samstag, wo nicht gearbeitet wurde) mußte ich erst mal das system reparieren... dann lieber erst mal ohne systemredundanz, aber mit funktionierendem backup.

ich tippe am ehesten auf strom/backplane-probleme, bin mir aber nicht sicher. der serverhersteller n-tec hat noch keine rückmeldung geliefert.

bitte, falls ihr ideen habt, nur heraus damit. ich bin mitlerweile sehr entnervt, und die ganzen tests (s.o. haben mich schon 2 wochenenden gkostet.


viele grüße,
seaslug

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Montag, 20. August 2007, 03:25

halte ich auch für ein stromproblem

habe sowas ähnliches mit scsi backplanes gehabt

da hat der controller sobald er gemerkt hat dass die hdd zu wenig strom bekommen hat oder wie auch immer die hdd ausgeschaltet und dann wieder eingeschaltet
For Windows reboot
for Linux be root

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Dienstag, 21. August 2007, 23:50

Zitat von »seaslug«

... und ich mich erinnere, daß tom ähnliche server laufen hat, hoffe ich auf gute ideen.

Sorry, ich hab' den Thread erst gerade eben entdeckt.

Zitat

1: Gelegentliches Auftreten (außerhalb der Backup-Zeit) des Fehlers: "Das Gerät ... IASTOR ... hat innerhalb der Fehlerwartezeit nicht geantwortet." im Ereignisprotokoll. Während des DLT-Backups häufigeres Auftreten (alle 2-3 Tage).

... kommt mir bekannt vor ;)

Die Kiste läuft absolut wunderbar, aber unter (kombinierter) Last fängt irgendwas zu spinnen an.
Da ich annehme, daß Du das Thema Netzteil und Spannungszusammenbrüche bereits abgehandelt hast, bleiben nur BUS- und Timing-Probleme übrig.

Normalerweise hätte ich gesagt: "PCIX-BUSse anders verteilen, aber das bringt bei diesem Layout (siehe Manual, Seite 1-8.) nix.
Nachdem fast Alles in der ESB2 steckt, bleibt eigentlich nur der 29160 übrig, der hier spinnt.
Steck' den mal in den Slot#3 und drossele die PCIX-Frequenz (siehe BIOS-Einstellungen im Manual, Seite 4-10).
Wenn's immer noch spinnt, solltest Du ihn mal ausbauen und den Server ohne den Controller testen.

Was mir dabei gerade einfällt: Überprüfe mal die Version Deiner Chipsatztreiber - insbesondere die für die PXH.
BIOS und (WHQL-)Treiber sollten bei einer Neuinstallation immer auf dem aktuellem Stand sein - Auf den Hersteller-CDs ist zum Teil reichlich veraltetes Zeug drauf.

BTW: Wenn's jetzt geht, würde mich das nicht sonderlich wundern - Adapt(r)eck ist immert für ein paar Überaschungen gut.
Bei mir ist das fast schon eine Regel:
Immer wenn ich merkwürdige Storage-Probleme hatte, war schlußendlich meißt Adaptec der Übeltäter.
Nun habe ich eine ganze Reihe Server, bei denen der (Onboard-)Adaptec lahmgelegt, und stattdessen LSI-HBAs eingebaut wurden.
Ggf: solltest Du das Ding austauschen - evtl. gegen dieses oder noch besser jenes.
ACHTUNG_1: Es kann sein, daß Du Probleme mit der Boot-Reihenfolge bekommst.
ACHTUNG_2: Keine Ahnung, ob sich die LSIs mit Deinem BIOS vertragen.
Am besten schreibst Du eine Mail an Supermicro und fragst, ob das Ding unterstützt wird.

mfg, Thomas

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Montag, 3. September 2007, 00:57

hi tom,

danke für deine antwort. letzte woche war die hölle los, bin zu nichts mehr gekommen.

am netzteil liegt´s wohl nicht, allerdings hatte ich jetzt das erste mal (bei einem backup auf hdd) einen 0x00000077 stop - fehler kernel_stack_inpage-error, statt des "gewohnten" freezes, was ja unter anderem auch auf den controller hindeutet...
habe das ganze we plattentest gemacht (spiegeln, abziehen des zwillings, checkdisk. hat aber nichts relevantes gebracht, wenn man von kleinen, nicht mehr benutzten verweisen, sicherheitsbeschreibungen absieht, aber das ist ja vielleicht auch nicht verwunderlich bei "freeze und aus". fehlerhafte sektoren wurden nicht gefunden.

du schreibst: Was mir dabei gerade einfällt: Überprüfe mal die Version Deiner Chipsatztreiber - insbesondere die für die PXH." was meinst du mit pxh?

zu der adaptec-problematik: der iastor fehler trat auch bei gezogenem adaptec auf (s. 1. beitrag)... wenn auch nicht so häufig.

habe jetzt 4 identische, neue hdd´s bestellt, damit ich mit etwas weniger risiko weiter "rumprobieren" kann.
vom "gefühl" her, denke ich, daß es sich um 2 fehler handelt... ich hasse das, auf der produktionsumgebung herumprobieren zu müssen.


gruß seaslug

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Dienstag, 4. September 2007, 02:30

Zitat von »seaslug«

du schreibst: Was mir dabei gerade einfällt: Überprüfe mal die Version Deiner Chipsatztreiber - insbesondere die für die PXH." was meinst du mit pxh?

Das ist der Chip, der unter Anderem die PCI-X Bridge beinhaltet.
Das sollte in der Geräteliste als "5000P PCI(X)-Bridge" oder so ähnlich auftauchen.
I.d.R. gibt's hierfür zwei Treiberversionen: Eine mit, und eine ohne Hotplugging.

Zitat

zu der adaptec-problematik: der iastor fehler trat auch bei gezogenem adaptec auf (s. 1. beitrag)... wenn auch nicht so häufig.

Wie? - Ein nacktes Board, nur mit ESB2 - und diese Kombination spinnt?
... das ist allerdings sehr merkwürdig.
Die Backplanes und Kabel hast Du sicher schon geprüft/gewechselt.
Und der MemTest ist auch schon ein paar Nächte gelaufen.

Ich sehe gerade, daß Du 4GB RAM bestückt hast.
... ganz blöde Idee: Nimm' mal einen oder zwei Riegel raus.

Wohin mappst Du die PCI-IO-Bereiche?
Wohin (re)mappst Du den Speicher? Wie nutzt Du den?
Kann der Standard-SBS überhaupt PAE?

mfg, Thomas

Edit: Vergiss' nicht das Netzwerkkabel zu den NTDS-Clients herauszuziehen (einfach den Server abklemmen).
Wenn Du die Probiersession online machst, und danach wieder die "alten" Platten reinsteckst, gibt's jede Menge veraltete Tickets und für Dich eine Menge Handarbeit.

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Dienstag, 4. September 2007, 02:54

hallo tom,


danke für die info!
der server läuft nun schon seit 10 tagen mit 2 gb, ohne besserung.

wegen der backplane habe ich mich schon gefragt, ob ich die platten nicht ohne diese anschließen kann. das müßte doch gehen?

"Wohin mappst Du die PCI-IO-Bereiche?
Wohin (re)mappst Du den Speicher? Wie nutzt Du den?
Kann der Standard-SBS überhaupt PAE?"

kannst du da mal konkreter werden? so verstehe ich das nicht so ganz. was soll den "PAE" sein?

"Edit: Vergiss' nicht das Netzwerkkabel zu den NTDS-Clients herauszuziehen (einfach den Server abklemmen). "
klar. wäre auch schlecht, wenn exchange derweil mails abholt, die dann weg wären...


gruß,
seaslug

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Dienstag, 4. September 2007, 20:38

Zitat von »seaslug«

wegen der backplane habe ich mich schon gefragt, ob ich die platten nicht ohne diese anschließen kann. das müßte doch gehen?

Natürlich geht das - zumindest bei SATA, weil der i.d.R. einfach nur "Punkt-zu-Punkt" durchgeschleift wird.

Zitat

"Wohin mappst Du die PCI-IO-Bereiche?
Wohin (re)mappst Du den Speicher? Wie nutzt Du den?
Kann der Standard-SBS überhaupt PAE?"

kannst du da mal konkreter werden? so verstehe ich das nicht so ganz. was soll den "PAE" sein?

Nur ganz kurz, weil ich in Eile bin ...
Normalerweise liegen im Adressbereich ab 3GB die IO-Bereiche des PCI-BUSes.
Bei Speicherbestückung über 3GB muß diese Doppelbelegung irgendwohin (re-)mapped werden.
I.d.R. wird der Speicher einfach ab 4GB wieder eingeblendet.
Und nachdem ein 32-Bit-System mit Adressen über 4GB nix anfangen kann, gibt's dafür die PAE (=physical address-extension).

Es gibt aber eine ganze Reihe Treiber, die mit den verschiedenen Adress-Erweiterungen und Speicherstrategien von Windows nicht klarkommt.
Insbesondere mit PAE (Schalter "/3GB") klemmt's scheinbar besonders häufig.

Mein Lieblingsbeispiel für solche Murks-Soft lieferte ATI.
Es gab mehrere Catalysten, die schon bei einer einfachen Änderung der Cache-Strategie (LSC) abgesoffen sind.

mfg, Thomas

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Mittwoch, 5. September 2007, 01:06

hi tom,

danke für deine geduld!
da der server jetzt mit 2 gb läuft, kann ich die speicherproblematik bezüglich der größe wohl erst mal außen vorlassen..?

dann werde ich für´s wochenende mal die hdds ohne backplane anschließen sowie doch bios und treiber aktualisieren.

die grafikkarte kann ich ja logischer weise nicht tauschen (das die ati-treiber zuweilen großer mist sind, weiß ich), aber ich könnte probeweise mal die standard-vga-treiber benutzen.

ich berichte mal über die fortschritte. danke nochmal,

gruß seaslug

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Mittwoch, 5. September 2007, 20:31

Zitat von »seaslug«

da der server jetzt mit 2 gb läuft, kann ich die speicherproblematik bezüglich der größe wohl erst mal außen vorlassen..?

Genau.
Stell' die Kiste mal auf "ganz doof":
Virtueller Speicher auf weniger als 2GB, sodaß realer+virtueller Speicher weniger als 4GB ergibt.
Prozessorzeit-Optimierung auf "Programme"
Speichernutzungs-Optimierung auf "Programme"

... bei der Gelegenheit würde ich gerne wissen, welche Schalter in der BOOT.INI drinnen stehen.

Zitat

dann werde ich für´s wochenende mal die hdds ohne backplane anschließen sowie doch bios und treiber aktualisieren.

Aktuellstes BIOS installieren ist immer empfehlenswert.
Ich hab' schon die tollsten/merkwürdigsten Fehler gesehen, weil die MicroCode-Version nicht passt.
Achte beim Treiber-Update unbedingt darauf, daß Du WHQL-Treiber nimmst.

Zitat

die grafikkarte kann ich ja logischer weise nicht tauschen (das die ati-treiber zuweilen großer mist sind, weiß ich), aber ich könnte probeweise mal die standard-vga-treiber benutzen.

Don't Panic!
Für die üblichen Server-Grafikchips (meißt ATI Rage-Pro/XL) nimmst Du natürlich die Microsoft-Treiber.
Die "Windows-eingebauten" Treiber sind i.d.R. sorgenfrei.
... nur nicht der Mist, den APC so abliefert - aber das ist ein anderes Thema.

mfg, Thomas

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB

Montag, 17. September 2007, 02:45

hi tom,

danke nochmal für die ausführlichen tips!
nachdem ich letztes we keine zeit hatte, habe ich jetzt weitergemacht, und die ursache gefunden: es ist die beschissene backplane gewesen!!!
nachdem jetzt alle platten direkt angeschlossen sind, läuft die kiste wunderbar, ohne die geringsten probleme unter stundenlanger plattenvollast.
jetzt kann ich diese (teile der) kiste monieren. muß mich mal schlau machen, ob ggf. eine andere backplane/einschübe besser sind (z. zt. chenbro case). kannst du mir da einen rat geben?

an sonsten behalte ich jetzt den server weiter genau im auge, werde in einer woche die caches wieder aktivieren.

viele grüße,
seaslug

Re: INTEL-RAID PROBLEM, SBS2000 SuperMicro MB -gel

Donnerstag, 20. September 2007, 03:25

hi,

kurzer nachtrag: bekomme eine neue backplane, mit neuerer revision (die alte war ja "schon" 8 monate alt), die´s seit kurzem gibt. warum wohl..?!

gruß seaslug