TIER-Designer – Hochverfügbarkeit vs. Faktor Mensch

Bei einem Rechenzentrum dreht sich alles um die Verfügbarkeit. Dies bedingt eine hochredundante Strom- und Kälteversorgung. Dafür zuständig sind TIER-Designer. Was sie genau tun, welche Rolle der Faktor Mensch spielt und worum es überhaupt bei TIER geht, erzählt uns TIER-Designer Urs Schümperli.

Urs, du wurdest Anfang des Jahres vom renommierten Uptime Institute in New York zum TIER-Designer ausgezeichnet. Herzliche Gratulation! Was heisst TIER?

TIER ist ein Rechenzentren-Standard, genauso wie der geläufigere Standard TÜV. TIER wurde von über 25 Jahren vom Uptime Institute in New York entwickelt und beurteilt die Fähigkeit einer Rechenzentrumsinfrastruktur, ob und wie sie das von der Kundschaft erwünschte Leistungsniveau erreichen kann. Aktuell werden rund 2’500 Rechenzentren in über 110 Ländern auf der ganzen Welt von unabhängigen und externen Prüfer*innen nach TIER klassifiziert. Das heisst, es hat sich weltweit zu einem Standard etabliert.

Du bist als TIER-Designer nicht direkt für die Zertifizierung des Rechenzentrums zuständig. Was ist stattdessen deine Funktion?

Ein TIER-Designer entwickelt Elektroenergie- und Kälteversorgungskonzepte gemäss den TIER-Anforderungen der Kund*innen. Anders gesagt, wir werden mit einem Konzept beauftragt und klären gemeinsam mit der Kundschaft, nach welchem TIER-Standard das Rechenzentrum gebaut werden soll und erarbeiten nach diesen Vorgaben ein Konzept. Ich persönlich arbeite vor allem für die Elektroversorgung und unterstütze bei Bedarf intern unser Team Kälte.

 

Kannst du TIER-Standards grob erklären?

Bei der Konzeption einer Rechenzentrumsinfrastruktur stellt sich die Frage nach der Verfügbarkeit (Uptime). Sie wird der möglichen Ausfallzeit (Downtime) gegenübergestellt. Das heisst, anhand der Konzeption nach TIER kann die Verfügbarkeit in Prozent errechnet werden. Es gibt TIER-Levels von 1 bis 4. Die Infrastruktur des Levels 1 ist am einfachsten, während 4 am meisten Komplexität aufweist, alle in den darunter liegenden Komponenten auch beinhaltet und somit die höchste Redundanz gewährleistet. Ein Rechenzentrum nach Level 1 stützt sich auf nur einen Versorgungsweg für Strom und Kühlung. Damit ist mit einer jährlichen Ausfallzeit von 28,8 Stunden zu rechnen, was einer 99,67-prozentigen Verfügbarkeit entspricht. Zum Vergleich: Ein Level 4-Rechenzentrum hat eine enorm hohe Fehlertoleranz aufgrund zwei aktiv eingerichteter Versorgungswege für jede Komponente. Mit dieser Redundanz ist mit einer jährlichen Ausfallzeit von nur 0,8 Stunden, was einer 99,991-prozentigen Verfügbarkeit entspricht, zu rechnen, die Verfügbarkeit ist demzufolge sehr hoch. So gesehen kann man von vier Qualitätsstufen sprechen. Das soll aber nicht heissen, dass alle Rechenzentren nach TIER 4 geplant werden sollen. Für manche Rechenzentren ist TIER 1 absolut ausreichend und TIER 4 wäre völlig übertrieben.
 

  

Was sind die besonderen Herausforderungen eines TIER-Designers?

Unsere Aufgabe ist es, sehr komplexe Strom- und Kälteversorgungskonzepte möglichst einfach zu gestalten. Denn je einfacher das Design, desto weniger Fehlmanipulationen sind in der Anwendung möglich. Wir dürfen den Faktor Mensch nie vergessen.

«Angstverbindungen suggerieren eine vermeintliche Sicherheit und werden zur Fehlerquelle.»

Urs Schümperli
Teamleiter

Wie wird der Faktor Mensch einkalkuliert?

Mit eben dieser Einfachheit. Und keinesfalls mit sich fälschlicherweise aufdrängenden, zusätzlich eingebauten «Angstverbindungen». Sie suggerieren eine vermeintliche Sicherheit und werden irrtümlicherweise zur Fehlerquelle. Ich als TIER-Designer erarbeite beispielsweise ein Konzept nach TIER 4, plane mit einer gut gemeinten Redundanz eine unnötige «Angstverbindung» ein und stufe mit dieser Zusatzverbindung eine Fehlerquelle ein, die mein TIER 4-Rechenzentrum direkt auf TIER 2 herunterstuft. Schlussendlich ist es unabhängig von der Kälte- oder Elektroversorgung so, dass der Faktor Mensch der schwierigste Punkt ist, sei es im Design oder in der Anwendung.

Der Austausch mit den involvierten Parteien scheint sehr wichtig zu sein.

Ja, das trifft auf jeden Fall zu. Ich profitiere dabei enorm vom Kurs als TIER-Designer. Es fällt mir leichter, unsere Überlegungen aufzuzeigen oder zu begründen, intern wie auch extern. Rechenzentren gehören zu den wenigen Gebäuden, bei denen das Innenleben die Architektur bestimmt und nicht umgekehrt. Die Level 4-Anforderung von zwei aktiv eingerichteten Versorgungswegen für jede Komponente, erfordert entsprechende bauliche Massnahmen mit separaten Brandabschnitten, Steigzonen und möglichst kurzen Distanzen. Wir tauschen uns also erst nach Erarbeitung unseres Strom- und Kälteversorgungskonzeptes nach TIER mit den Architekt*innen aus und auch hier ist es nun einfacher, unsere Überlegungen zu erläutern und mit ihnen im Dialog das Rechenzentrum weiterzuentwickeln. Wer mit Rechenzentren arbeitet, erkennt sie von aussen.