Die Bewertung der einzelnen Hersteller

Vorbemerkung: Die Leistung einer CPU läßt sich nicht allein von ihrer Taktfrequenz ableiten. Zwar ist ein Pentium 100 sicherlich schneller als ein Pentium 75, aber ein 486er mit 100 Megahertz kommt wegen seiner einfacheren Architektur mit dem kleinen Pentium 75 nicht mehr mit. Genau diese Unterschiede in der Implementierung von internen Einheiten der CPU sind es aber, die innerhalb der Pentium-Klasse für Leistungsdifferenzen sorgen. So bringt ein Cyrix 6x86 mit 100 Megahertz eine höhere Leistung als ein Pentium 100 von Intel.

Aus diesem Grund haben die Hersteller von Intel-kompatiblen Chips - mit Ausnahme von Intel selbst - vor kurzem die P-Wertung vereinbart. Diese Kennziffer besagt, daß der Prozessor mit dem Kürzel P120 die Leistung eines Pentium 120 erreicht oder übertrifft. Gemessen wird diese Leistung mit einem Anwendungsprogramm-Benchmark, allerdings ausschließlich unter Windows 95. Damit will man dem Käufer eine Meßlatte an die Hand geben, die eine Einschätzung der CPU-Leistung gestattet. Diese Klassifizierung ist für 32-Bit-Anwendungen jedoch unter Umständen nicht zutreffend.

Prozeßverarbeitung

Nun aber zu den Prozessoren: Da sind auf der einen Seite die traditionellen Pentiums: Mit zwei Ganzzahleinheiten und einer Fließkommaeinheit könnte der Prozessor theoretisch drei Instruktionen gleichzeitig verarbeiten. Praktisch eignen sich jedoch nur die beiden Integereinheiten des Pentium zur Parallelverarbeitung.

Für ihre Teamarbeit muß man die Einheiten aber auch gleichzeitig beschäftigen. Dies ist nur möglich, wenn die Befehle genau passend angeliefert und reibungslos verarbeitet werden.

Die Anlieferung eines Befehls an die jeweilige Einheit erfordert einige Arbeitsschritte im voraus: Zunächst wird der Befehl aus dem Speicher (Arbeitsspeicher oder Cache) geholt. Anschließend wird die Instruktion dekodiert (Stufe Dl); dabei wird ermittelt, ob der Befehl in einer oder beiden Pipelines verarbeitet werden kann.

Im nächsten Schritt (D2) wird die Operandenadresse des Befehls ermittelt. Erst dann beginnt die eigentliche Verarbeitung. Im letzten Abschnitt dieser Fünf-Stufen-Pipeline wird das Ergebnis abgelegt. Wichtig ist, daß der Pentium-Prozessor nur in einer Pipeline (u-pipe) alle Befehle verarbeiten kann, während die zweite Pipeline (v-pipe) nur einfache, hartkodierte Befehle verarbeiten kann.

Weil aber die Schritte in der Pipeline für jeden Befehl in dieser festgelegten Reihenfolge sein müssen, wird ein "Förderband" eingerichtet, auf dem jede Stufe der Vorveratbeitung ständig ihren Job erledigt und das Ergebnis an die nächste Station schiebt. Dieses "Pipelining" gibt es seit dem 486er Prozessor, der jedoch nur eine Ganzzahlen-Verarbeitungseinheit besitzt und nicht parallel arbeiten kann. Auch der AMD 586 P75/133 ist ein Vertreter genau dieser Gattung.

Beim Pentium werden die beiden Integereinheiten über zwei Pipelines mit Daten gefuttert. Hier liegt jedoch genau die Tücke: Die ganze Parallelverarbeitung funktioniert nur, solange sich die beiden Instruktionen unabhängig voneinander ausfahren lassen. Sobald ein gemeinsames Register des Prozessors benutzt wird, steht eine der Pipelines still. Viel schlimmer kann es kommen, wenn eine Pipeline einen Sprungbefehl abarbeitet. Der Befehl in der zweiten Verarbeitungsschlange wird unter Umständen gar nicht mehr gebraucht; die Vorarbeit war umsonst. Daher gibt es auf dem Pentium einen Branch Target Buffer (BTB), der das Sprungziel mit einer bestimmten Treffsicherheit vorhersagt. Führt die Vorhersage jedoch ins Leere, muß die Pipeline gelöscht und neu begonnen werden.

Damit dieser zeitraubende Vorgang möglichst selten passiert, haben die Chiphersteller - darunter AMD, Cyrix, NexGen und Intel beim Pentium Pro weitere Mechanismen eingeführt, welche die Pipelines entkoppeln oder stellenweise bewußt zusammenfahren. Dazu gehört das Speichern der Ergebnisdaten in Pseudoregistern sowie das Vergleichen und Berücksichtigen der Befehlsfolge in verschiedenen Pipelinestufen. Die zusätzliche, spekulative Ausführung von Befehlen, die Umgruppierung von Befehlen ("out of order execution") und die Erweiterung des BTB auf mehrere Stufen schaffen zusätzliche Möglichkeiten, die Geschwindigkeit zu steigern.

Diese Konzepte werden beim Cyrix 6x86, beim NexGen 586 und beim Pentium Pro umgesetzt; für den AMD K5 und den NexGen 686 sind sie angekündigt.

Intels neuer Renner namens Pentium Pro geht aber noch vehementer an die vordringlichste Zielvorgabe: Mit drei Pipelines schafft sich der Chip eine weitere Parallelisierung. Dazu kommt, daß er die Befehlspipeline in 14 Stufen aufsplittet. Der Vorteil: kürzere Durchlaufzeiten in einzelnen Bereichen der Pipeline und eine bessere Vorhersage von Befehlsauswirkungen. Trotzdem haben die IntelIngenieure ihren Prozessor zu sehr auf den 32-Bit-Code getrimmt: Bei häufigem Wechsel von Lesen und Schreiben auf ein Register, wie es bei 16-Bit-Code öfter vorkommt, klemmen die Pipelines. Auch NexGen benutzt drei parallele Einheiten zur Verarbeitung von Integerbefehlen, während der K5 mit zwei Integereinheiten arbeitet.

Vergleiche der einzelnen Hersteller

Bei 16-Bit-Programmen erweiste sich der Cyrix 133 P166 als effizientester Prozessor. Die Pentium-Pro-Prozessoren kommen bei den 16-Bit-Anwendungen einfach nicht richtig auf Touren. Die Pentium-Pro-Prozessoren werden sogar noch vom Pentium 166 übertrumpft.

Doch bei Win95 trumpft der Pentium Pro auf, denn hier wechseln sich 16- und 32-Bit-Befehle einander ab.

Unter Windows NT trumpfen die 32-Bit-Experten auf. Hier brausen die beiden Pentium-Pro-Maschinen auf und davon. Mit weitem Abstand fährt der Pentium 166 auf Rang drei ein - dicht gefolgt vom Cyrix 133. Der 120er Cyrix überholt im letzten Moment noch den Pentium 150. Schlußlicht ist diesmal der AMD P75.

Knapp davor liegen der NexGen 586-100 und der Pentium 75.

Als klarer Sieger geht der Pentium Pro 200 aus der Chip-Rallye hervor. Er ist etwa 50 Prozent schneller als ein Pentium 100.

Newcomer Cyrix 133 P166 setzt sich auf den zweiten Platz. Auf Rang drei plaziert sich der zweite Pentium Pro. Nicht mehr auf die Medaillenränge dieses Rennens fährt der Pentium 166, der knapp hinter dem Pro 150 rangiert.

Die folgende große Lücke wird durch den Cyrix 120 P150 ausgefüllt, der ein gutes Stück über dem Pentium 150 liegt. Es folgen Pentium 133 und Pentium 120.

Dann kommt der Cyrix 100 auf Platz 9, der damit sein P120-Versprechen knapp verfehlt. Dann sieht der Pentium 100 die Zielfahne, gefolgt von Pentium 90 und NexGen 586 PF 110.

Das hintere Feld wird vom Pentium 75 angeführt. Der AMD 5x86 P75 133 liegt auf dem vorletzten Platz vor dem - durch fehlenden Koprozessor gehandikapten -NexGen 586 100.

Doch pure Leistungsschau alleine bestimmt nicht die Entscheidung für den einen oder anderen PC. Vernunft und Geldbeutel sind die Faktoren, die letztendlich die Kaufentscheidung bedingen. Setzt man die Leistung mit dem aktuellen Preis ins Verhältnis, liegen die leistungsschwächeren Prozessoren vorn. Nicht zu vergessen: Das bevorzugte Betriebssystem gibt für die individuelle Entscheidung für den einen oder anderen Chip den Ausschlag. Auch die peripheren Komponenten wie Cache, Speicher, Grafik und Festplatte haben erheblichen Einfluß auf die Leistung - allerdings wurde dieser Faktor bei diesem Test bewußt egalisiert.

Zu beachten sind auch andere Rahmenbedingungen: Der NexGen wird beispielsweise nur komplett mit einem Motherboard ausgeliefert; das macht sich beim Preis-Leistungs-Verhältnis bemerkbar. Für die Berechnung sollte hier der Systempreis - abzüglich 150 Dollar für eine Pentium-Hauptplatine zugrunde gelegt werden. Bei Cyrix-Rechnern ist eine Anpassung des BIOS notwendig, damit der Chip zur vollen Leistung aufläuft. Das einfache Einsetzen eines 6x86 in eine Pentium-Hauptplatine läßt diesen "Porsche" nur im ersten Gang fahren. Die Probleme einiger Chips mit OS/2 zeigen, daß an bestimmten Stellen nachgebessert werden muß. Unter Microsoft-Betriebssystemen laufen sämtliche Prozessoren ausgezeichnet.

Intel ist derzeit mit der Neuentwicklung mehrerer Chips beschäftigt. Z.B. Mit einem Chip, der intern als PS5C bezeichnet wird. Dieser Baustein basiert auf dem Pentium-Prozessor, wird jedoch um Multimediabefehle erweitert. Zu den Multimedia Extensions (mmx) gehören Instruktionen, die Vektor- und Matrixoperationen beschleunigen. Diese für die Videoverarbeitung nötigen Befehle werden noch mit herkömmlichen Instruktionsfolgen nachgebildet. Intel verspricht einen besonderen Leistungsschub für die Software-MPEG-Dekodierung.

Auch an eine schnelle Verarbeitung von Multiply-Accumulate-Befehlen wird gedacht. Diese Operationen sind das Leibgericht der digitalen Signalprozessoren (DSP) und ermöglichen eine Vielzahl von Anwendungen wie Audiobearbeitung, Effekte und Signalfilterung. Der neue Chip soll rund 100 Dollar mehr kosten als ein vergleichbarer Pentium-Prozessor.

Für den Standard-Pentium wird es die erwartete Erhöhung der Taktfrequenz geben. Seit Ende 1996 läuft der 200er vom Band; der ursprünglieb geplante 180er-Pentium wurde nicht produziert.

Eine weitere Entwicklung läuft unter dem Codenamen Klamath. Dieser Prozessor soll als Derivat des Pentium Pro auf den Markt kommen; er soll ebenfalls um Multimedia-Instruktionen erweitert sein. Ein Detail des Pentium Pro wird Klamath allerdings fehlen: Der integrierte und derzeit kostenintensive Level-2-Cache wird nicht mehr eingebaut.

Nachfolger des Pentium, P7

Verschoben hat sich hingegen die Einführung des P7, der unter dem Codenamen Merced entwickelt wird. Laut "Microprocessor Report" soll der Chip nicht vor Mitte 1998 das Licht des Verkaufsraums erblicken. Mit diesem Chip will Intel auch eine neue 64-Bit-Code-Basis einführen, die der Chipgigant zusammen mit Hewlett-Packard entwickelt. Unter dem Stichwort VLIW (Very Large Insiruction Word) werden alle Befehle in eine konstante, teilweise parallele Form kodiert. Dadurch soll besonders die Dekodierung der Instruktionen vereinfacht werden.

Prozessor der Zukunft

Der Prozessor der Zukunft wird immer mehr Komponenten eines Computers enthalten.

Auch bei Cyrix sind die Entwickler fleißig am Werk. Der jüngste Vorstoß geht in Richtung Integration. Unter dem Kürzel VSA (Virtual System Architecture) werden mehrere neue Chips entwickelt. Auf Basis des 6x86 wollen die Texaner unter dem Codenamen M2 eine erweiterte Version des Chips bis Anfang 1997 herausbringen. Auch hier stehen die Multimediafähigkeiten im Vordergrund: Der Chip soll eine Soundkarte per Software nachbilden können und die Fähigkeit eines Softwaremodems enthalten.

Der M2 wird ebenfalls die Unterstützung für Video erhalten, und man denkt, ebenso wie Intel, an Software-MPEG-Dekodierung (MPEG-2) sowie Videokonferenzen.

Erst 1998 soll der M3 herauskommen. Dieser Prozessor wird als Gegenstück zu Intels P7 mit Eigenschaften wie einer 64-Bit-Architektur aufwerten. Ob Cyrix auf den VLIW-Zug zur Vereinheitlichung aufspringt, ist zweifelhaft. Cyrix will für den Prozessor der siebten Generation in jedem Fall an dem X86kompatiblen Befehlssatz festhalten.

In eine andere VSA-Richtung zielt der Vorstoß des Cyrix 5gx86. Dieses System vereint neben dem 5x86-Prozessor den Grafikchip und die Multimedia-Einheiten in zwei Plastikgehäusen. Pfiffigerweise basiert die GX-Entwicklung auf einer Unified Memory Architecture (UMA).

Hierbei wird ein Teil des Hauptspeichers beim Booten für den integrierten Grafikchip reserviert und dient fortan als Bildspeicher. Die Wavetables für die Soundkarte sind ebenso in einem Teil des Hauptspeichers abgelegt. Günstig ist die UMA, weil immer nur der Teil des Speichers belegt ist, der wirklich gebraucht wird. Dieses Konzept, prädestiniert für Notebooks, könnte auch im Low-End-Desktop-Markt für Bewegung sorgen.

Etwas still ist es um AMD geworden, da sich der K5 doch lange Zeit verzögert hat. Angekündigt war das Stück Silizium für Frühjahr 1996, doch für den Prozessorvergleich war noch kein Muster erhältlich. Allerdings liegen AMD selbst schon erste Erfahrungswerte mit dem K5 vor. Demnach soll der jetzt vorliegende Prozessor mit Codenamen SSA5 bei 16-Bit-Applikationen in seiner Leistung auf Pentium-Niveau liegen. Bei 32-Bit-Programmen sagt AMD dem SSA5 eine 30 Prozent höhere Leistung nach als einem Pentium mit gleicher Taktrate. Der echte K5, der bei Erscheineu 5K86 P133 heißt, soll hingegen auch im 16-Bit-Bereich ein Drittel über der Pentium-Leistung liegen.

Siehe auch: K5-Architektur