Das folgende Problem entdeckte ich auf einem unserer Kundensysteme in der vergangenen Woche. Bis zur Lösung des selbigen vergingen zwar nur ein paar Stunden, allerdings war ich beim ersten Auftreten ziemlich irritiert.

Jeder Administrator kennt und nutzt ein Kommando um Systeme im Netzwerk auf Erreichbarkeit zu prüfen – nämlich Ping. So auch ich.

Problem

Typischerweise antwortet ein ange’ping’tes System auf einen Ping unter Windows mit folgender Nachricht (so es denn erreichbar ist):

Antwort von [IP-Adresse] Bytes=32 Zeit=[Zeit in Millisekunden] TTL=[Time to Live]

Diese Zeilen sind wohl den meisten Lesern vertraut. Sicher wird sich jeder meinen Gesichtsausdruck vorstellen können, als ich bein einem Ping im internen Netzwerk (in unregelmäßigen Abständen, aber wenigstens aller etwa 20 Sekunden) folgende Antwort-Blöcke erhielt:

Antwort von xxx.xxx.xxx.xxx Bytes=31 Zeit=-76ms TTL=128
Antwort von xxx.xxx.xxx.xxx Bytes=31 Zeit=-76ms TTL=128
Antwort von xxx.xxx.xxx.xxx Bytes=31 Zeit=-76ms TTL=128
Antwort von xxx.xxx.xxx.xxx Bytes=31 Zeit=-76ms TTL=128

Statt einer Zeile erhielt ich auf einen Schlag 10 bis 15 Zeilen auf einmal. Danach erhielt ich einige “normale” Antworten mit positiven Zeiten der Paket-Umlaufzeit (Round Trip Delay). Den Test konnte ich beliebig oft für alle möglichen Ziele wiederholen – immer mit dem selben, beschriebenen Verhalten.

Beim Lesen der Lösungshilfe stellte ich fest, dass der folgende, sporadisch gemeldete Fehler im Systemereignisprotokoll mit der Event-ID 1054 die selbe Ursache besitzt:

Der Domänencontrollername für das Computernetzwerk konnte nicht ermittelt werden. (Unerwarteter Netzwerkfehler. ). Die Verarbeitung der Gruppenrichtlinie wurde abgebrochen.

Ich entdeckte diesen Fehler nachträglich auf dem betroffenen System.

Ursache

Bei meiner Suche nach einer Lösung stieß ich auf die folgende Seite aus dem Hewlett-Packard Support Forum. Hier wird beschrieben, dass es bei einigen Server-Modellen von Hewlett-Packard unter verschiedenen Betriebssystemen zu Zeitproblemen kommen kann. Die betroffenen Modelle enthalten alle Opteron Prozessoren von AMD, als Betriebssystem kommt für Windows die Version 2003 (32 Bit und 64 Bit) in Frage.

Das eigentliche Problem ist seit 2008 bekannt. Bei den betroffenen Prozessoren läuft die Zeit zwischen den beiden Kernen langsam auseinander. Infolge dessen treten die unterschiedlichsten Probleme erst nach längerer Laufzeit auf diesen Systemen auf.

Lösung

Der betroffene Server war tatsächlich ein HP DL365 mit einem AMD Dual-Core Opteron Prozessor. Da das System nur selten neu gestartet wurde, kam ich also in den “Genuss” dieses merkwürdigen Verhaltens. Die Lösung ist dafür einfach und schnell umzusetzen: In der boot.ini muss der folgende Paramter eingefügt  und das System neu gestartet werden:

/usepmtimer

Dadurch wird dem Betriebssystem mitgeteilt, einen anderen Timer als den System Time Stamp Counter zu nutzen. Seit dem sind die oben beschriebenen Probleme beseitigt.

Fazit

Der AMD Opteron Prozessor wird mittlerweile nicht mehr in aktuellen Serversystemen verbaut, auch tritt das Problem ab Windows Server 2008 nicht mehr auf. Trotzdem kann es vorkommen, dass man das ein oder andere älter System administrieren muss – in diesem Fall soll dieser Beitrag als Hinweis und schnelle Hilfe dienen. Wie bei allen meinen Beiträgen gilt: Bei Tipps, Vorschlägen sowie Fragen oder Kritiken hinterlasst bitte einen Kommentar.