Ein Urmeter fürs Computing?

 
Heft 1/2010
 
Ein Urmeter fürs Computing?
Fotostrecke: (5 Bilder)

Autor: Dipl.-Ing. Jochen K.
Michels ist Unternehmensberater und untersucht seit 1985 die Marktpreise von IT-Diensten. Er koordiniert ein gemeinsames IT-Benchmarking in Deutschland, Österreich und der Schweiz.
E-Mail: jochen.michels@jomi1.com

Bild:
Jochen K. Michels

Völlig umdenken!Was macht ein CIO, wenn wieder einmal neue Server im Rechenzentrum gebraucht werden? Oder wenn er die physischen Kapazitäten durch Virtualisierung besser nutzen will? Oder wenn der Anbieter ihm nahelegt, mit einem Mainframe seinen Serverpark abzulösen? Oder umgekehrt, wenn er den alten Mainframe durch (wie viele) Server ersetzen möchte?

Heute ist die Sache klar: Er vergleicht Angebote, wälzt die Argumente seiner Planning-Crew, der Systemgruppe, der Anwendungsentwicklung und der Fachbereichsvertreter in Unterlagen und langen Besprechungen um und um. Danach bleibt er in der Regel bei seinem bisherigen Lieferanten, seiner Rechnermarke, seinem Outsource-Provider. Er bleibt sozusagen in der Familie – seien es nun Proliants, Poweredges, Primergies oder Power Systems , wenn es um Server geht. Ob der einzig verbliebene Mainframe-Vertreter ihm belastbare Daten zum Umstieg auf die hauseigenen Server bieten kann, bleibt dahingestellt.

Nun könnte man sich unabhängiger Berater bedienen, die sich mit Leistungsvergleichen und technischen Benchmarks auskennen. Diese sind weder zahlreich noch kostenlos. Was tun?

Da ein einzelner Server meist nicht sehr teuer ist, wischt man hier die Leistungs- oder Kapazitätsfrage schnell vom Tisch. Doch wenn Hunderte oder Tausende solchermaßen angehäufter Server betrieben werden, türmen sich die Probleme und die finanziellen Auswirkungen. Dann kommt man auch auf die Frage, ob sich das Ganze nicht mit weniger Hardware erledigen ließe. Empfehlungen der Berater, der Hersteller oder der Provider zielen in Richtung Rezentralisierung, Konsolidierung, Virtualisierung, Austausch, Auslagerung, Umstieg, Outsourcing oder Re-Insourcing. Damit stellt sich unausweichlich auch die Bewertung der Leistungsfähigkeit als Problem dar.

Fast immer scheitert aber die Frage nach vergleichbaren Werten sehr schnell an der fehlenden Normierung. Die DIN 66273 taugt nur sehr eingeschränkt und ist mit viel Aufwand verbunden. Dann wird umständlich nach Ersatzverfahren oder „Benchmarks“ gesucht. Da es keine offiziellen Standards gibt, muss man sich erfahrene Spezialisten buchen. Manchmal arbeiten diese mit eigenen Formeln und Vergleichstabellen, die man nicht recht durchschauen kann. Und ob das Ergebnis schließlich wirklich belastbar ist, muss man eher glauben als wissen.

Weltweit gibt es nur zwei Institutionen, die sich dieser Fragen annehmen. Die Standard Performance Evaluation Corporation (SPEC) entwickelt Benchmarks für Hochleistungsrechner. Von SPEC gibt es mehr als ein Dutzend verschiedene Benchmark-Methoden, die sich in Alter, Technik und Ergebnisaussage unterscheiden.

Der Transaction Processing Performance Council (TPC) definiert Benchmarks für Transaktions- und Datenbankverarbeitung. Auch hier gibt es mehrere unterschiedliche Verfahren. Diese von den Herstellern und anderen Interessenten getragenen Konsortien haben sich Regeln und Satzungen gegeben. Beide veröffentlichen geprüfte Resultate ihrer Mitgliedsfirmen und anderer Lizenznehmer. Solche Tests sind mit hohem Kosten- und Zeitaufwand verbunden. Die Vermessung von Servern kostet viele Wochen und Tausende von US-Dollar Lizenzen und/oder Projektgebühren. Nur wenige Server erhalten Testate von beiden Gremien, so dass eine durchgängige Bewertung fehlt. So sind Hewlett-Packard-Server vorzugsweise mit TPC-Werten versehen, die meisten Fujitsu-Server dagegen mit SPEC-Kennziffern. Bei DELL und IBM ist es ähnlich, Kein Hersteller lässt alle seine Server vermessen. So hat jeder Hersteller seine bevorzugte Methode oder verwendet gar ganz eigene Metriken.

Daher gibt es solche Werte niemals für alle Server eines Herstellers. Nur für die besonders gängigen unterzieht man sich der aufwändigen Prozedur. Auch die Favorittypen aus Marketingsicht haben eine Chance, vermessen zu werden. Die Hersteller tun sich oft äußerst schwer mit der Herausgabe von SPEC- oder TPC-Werten. Und keine Leistungszahl ist mit den anderen direkt vergleichbar. Daneben werden ständig ausgetüftelte Gefechte ausgetragen, um den Spitzenwert des Wettbewerbs um wenige „marcs“ zu übertreffen. Es wird an Compilern, Prozessoren, RAM und den Sammlungen der vielen Testsuites „gespielt“, um die jeweiligen Resultate zu optimieren. Das erschwert praxisnahe und pragmatische Vergleiche. Daher wird hier ein Maßstab vorgeschlagen, der ebenso einfach wie transparent ist. Die Genauigkeit ist dabei zwar nicht perfekt, bietet aber in vielen Fällen hinreichende Qualität.

Man bildet das Produkt aus den Prozessoren, Rechenkernen, Taktfrequenz und Arbeitsspeicher mit einer bestimmten Gewichtung. So bekommt man Werte, die weitgehend mit den Leistungskennziffern von TPC und SPEC parallel laufen. Wir nennen diese Kennzahl den Server-Leistungs-Wert (SLW). Bis auf einige Ausreißer bilden sie eine recht kontinuierliche Kurve. Dazu kommt als Vorteil, dass man diesen Wert selbst errechnen kann und daher nicht auf Hersteller oder Berater zurückgreifen muss.

Zur Erhärtung dieser Formel wurden etwa 1.500 verschiedene Servertypen untersucht, die uns von Teilnehmern der Aktion mitgeteilt wurden. Sie kommen von den Herstellern IBM, Fujitsu, Siemens, HP und Dell. Davon haben etwa 1.000 einen TPC-Wert, der zwischen 4 Millionen und 200 liegt, eine enorme Spanne. Etwa 300 – vornehmlich Fujitsu-Server haben einen Wert für den Specrate-2006-Test. Der „rate“- und der „rate-base“-Benchmark sollen vor allem den Durchsatz anzeigen und liegt zwischen 20 und 300. Die anderen Server haben entweder keinen Benchmark-Wert oder Randgruppen-Werte wie OLTP, Specint2000, PVU.

Stellt man nun die SLW-Ergebnisse den TPC- und SPEC-Werten gegenüber, so ergeben sich Kurven, die gut korrelieren. Zwar gibt es auch Ausreißer, die sich um die SLW-Kurve scharen, doch sind ihre Abweichungen für viele Zwecke des IT-Finanzmanagements unbedeutend.

Die erste Grafik zeigt für etwa 800 verschiedene Servermodelle die SPEC-CPU2006-Werte und die kontinuierlich verlaufende Linie der errechneten SLW. Man erkennt, dass es eine ziemlich gute Korrelation gibt, jedoch auch eine gewisse Streuung der SPEC-Werte um die SLW-Kurve. Die eigentliche Ursache der Streuung ist aber wohl in Einflüssen zu suchen, die nicht an den drei SLW-Faktoren (Cores, Frequenz und RAM) festzumachen sind. Sie beruhen vielleicht auf einer gelungenen Bus-Architektur, einer optimierten Cachegröße, der Level-Abstufung oder auch der besonders gut getroffenen Programmabfolge bei den SPEC-Benchmark-Läufen.

Diese Raffinessen sind in den meisten Fällen, wo es um die betriebswirtschaftlichen Entscheidungen geht, von untergeordneter Bedeutung.

Die folgenden Diagramme sind alle gleich aufgebaut. Die x-Achse zeigt die Reihe der Server. Je nach verfügbaren Daten reichen sie von gut 100 Stück bis über 800 Server. Auf der y-Achse sind die errechneten SLW und die von den Herstellern freigegebenen Benchmark-Ergebnisse zu sehen. Je nach Dimension wurden die SLW um passende Faktoren erweitert, ohne die Korrelation zu verschiefen.

Was sind nun die Vorteile eines solchen Wertmaßstabes für die praktische Arbeit der IT-Leitung, des Controlling, der kaufmännischen Abrechnung? Es scheint, dass seine Anwendung vor allem eine Vereinfachung für viele Investentscheidungen bedeutet. Auch die Make-or-buy-Auswahl und die Abrechnung auf Nutzer werden vereinfacht. Wenn man die heutige grobe Granulierung nach Rechnerstunden oder nach „Stückserver“ ersetzen kann, ergibt sich eine genauere Einschätzung. Es ist nicht mehr nötig, in das oft umständliche Deuten der beiden proprietären Benchmarks einzusteigen. Man kann auf Berater für diese Aufgabe verzichten. Man braucht auch nicht mehr die Lieferanten um Angaben zu bitten, die diese nur widerstrebend herausgeben oder gar nicht haben. Auch braucht man nicht mehr in einer Rechnerfamilie eines Herstellers zu „denken“. Die hier verwendete Formel für den SLW ist eine einfache Multiplikation. Sie gibt schon sehr gute Korrelationsverhältnisse. Wir werden sie aber noch weiter testen und variieren, um eine noch engere Anpassung an die SPEC- und TPC-Werte zu erreichen.

Einladung zum Mitmachen

 

Um die Werte weiter zu erhärten, sind alle Leser freundlich eingeladen, ihre Serverdaten in aller Kürze mitzuteilen. Sie erhalten im Gegenzug jeweils eine aktuelle Auswertung ihres Serverparks.

Branchenguide 2011
CallCenter for finance 2011
CallCenter Verband