Risikomanagement Wie betriebssicher ist Ihr Rechenzentrum?

Autor / Redakteur: Rolf Walter / Melanie Krauß

Es ist das Worst-Case-Szenario, von dem alle hoffen, es möge niemals eintreten: Stillstand in der Produktion. Ein Ausfall der IT kann Unternehmen richtig ins Schleudern bringen. Zur Prävention hat der TÜV Rheinland einen „Elchtest“ für Data Center entwickelt.

Anbieter zum Thema

Wissen Sie, wie es um die physische Betriebssicherheit Ihres Rechenzentrums bestellt ist?
Wissen Sie, wie es um die physische Betriebssicherheit Ihres Rechenzentrums bestellt ist?
(Bild: photodune - wavebreakmedia)

Die Digitalisierung von Geschäftsprozessen schreitet rasant voran, auch und gerade in der Industrie. Im Industrial Internet of Things ist die Verfügbarkeit von Servern und Rechenzentren einer der zentralen Erfolgsfaktoren für ein Produktionsunternehmen. Um die Betriebssicherheit und Ausfallsicherheit von Rechenzentren objektiv zu bewerten, haben die Experten vom TÜV Rheinland einen eigenen Anforderungsstandard entwickelt. Der Kriterienkatalog, der insbesondere auf der Rechenzentrums-Norm DIN EN 50600 sowie auf eigenen Best-Practice-Erfahrungen und wichtigsten internationalen Richtlinien und Standards basiert, umfasst eine Betrachtung zur physischen Infrastruktur, mit der sich die Sicherheit und Verfügbarkeit in fünf verschiedenen Kategorien analysieren lässt.

Zu den allgemeinen Grundlagen, die der TÜV Rheinland näher analysiert, zählen Kundendaten, Verfügbarkeitsanforderungen, die Gefährdungsanalyse (Risk Management) und das Sicherheitskonzept. Im Bereich Baukonstruktion sind unter anderem Umfeld und Standort, Gebäudekonstruktion sowie Ausbau, Layout und das IT-Flächendesign relevant. In der Kategorie Technik spielen Aspekte wie die Brandmelde- und Löschanlage sowie die Zutrittssicherheit eine Rolle, außerdem die Gebäudeleittechnik, eine unterbrechungsfreie Stromversorgung, die Klimaversorgung sowie IT- und Netzverkabelung und Doppelboden.

Ebenfalls von Bedeutung sind Faktoren der allgemeinen Organisation. Gibt es ein Betriebshandbuch, wie gestalten sich die Organisationsabläufe, wie sind Logistik und Transport geregelt, gibt es regelmäßige Funktionstests? Wie werden Mitarbeiter eingewiesen? In puncto Betrieb spielen unter anderem Fragen in Bezug auf Wartung und Service sowie Ausbildung, Schulung, Qualifikation und Notfallübungen eine wichtige Rolle.

Der Auditprozess ist auf den individuellen Schutzbedarf der Organisation abgestimmt. Das Team Data Center Services vom TÜV Rheinland hat zahlreiche Unternehmen aus unterschiedlichen Branchen und Betreiber von Rechenzentren auditiert. Daneben haben die Experten auch bestehende Rechenzentren und Serverräume auf Herz und Nieren geprüft.

Service-Tipp

So erkennen Sie Handlungsbedarf bei der Betriebssicherheit

Es gibt einige Indikatoren, die Handlungsbedarf im Bereich Betriebssicherheit von Rechenzentren aufzeigen können. Hier ein kleiner Fragenkatalog für den Quick-Check:
  • Sind eventuelle Risiken im Rechenzentrum klar definiert? (Testen Sie regelmäßig eine Lastübernahme durch den Generator?)
  • Gab es in der Vergangenheit eventuell Störfälle, deren Hergang und Ursache sich nicht eindeutig klären ließen?
  • Existieren Verfahrensanweisungen für Störfälle und werden diese regelmäßig geübt?
  • Sind den Verantwortlichen die Inhalte von Wartungsverträgen rund um das Rechenzentrum klar?
  • Gibt es ein Monitoring darüber, welche Geräte wann den End-of-Life-(EOL-)Status erreicht haben?
  • Ist dem Rechenzentrum-Verantwortlichen bewusst, durch welche Maßnahmen sich Energie einsparen lässt?
  • Ist das Personal in der Bedienung der Technik ausreichend geschult?
  • Gibt es Gewissheit darüber, dass die Betriebsparameter optimal aufeinander abgestimmt sind?
  • Wer die eine oder andere Frage negativ beantworten muss, der hat Handlungsbedarf und sollte sich im Zweifelsfall Rat bei Experten holen. Bei einem Neubau geschieht das am besten in einer frühen Phase, denn dann lassen sich typische Fehlerquellen mit dem entsprechenden Know-how leicht identifizieren und ausschalten. Nachträgliche bauliche Änderungen hingegen sind oftmals aufwendig.

    Internationale Richtlinien und Standards

    Die spannendsten Anforderungen stellen in der Regel Integrationstests der Energie-, Kälte- und Sicherheits­technik dar. Mit diesen auch als „Elchtests“ für Rechenzentren bezeichneten Testabläufen wird die Technik von Rechenzentren auf Herz und Nieren geprüft. Ohne diese Tests kann der Betreiber eines Rechenzentrums nicht sicher sein, dass das Rechenzentrum an sich auch bei Störumschaltungen sicher funktioniert. Das aber fordern zahlreiche Normen. In vielen Projekten, die der TÜV Rheinland als Data Center Service qualitätssichernd begleitet, sind Integrationstests eine Voraussetzung für eine finale Abnahme durch den Bauherrn.

    Der TÜV Rheinland analysiert die Sicherheit und Verfügbarkeit der physischen Infrastruktur in den Kategorien Grundlagen, Baukonstruktion, Technik, Organisation und Betrieb.
    Der TÜV Rheinland analysiert die Sicherheit und Verfügbarkeit der physischen Infrastruktur in den Kategorien Grundlagen, Baukonstruktion, Technik, Organisation und Betrieb.
    (Bild: photodune - wavebreakmedia)

    Die Integrationstests legen nach der Inbetriebnahme offen, ob die hochkomplexe technische Gebäudeausrüstung zuverlässig funktioniert – eine zentrale Voraussetzung für die Abnahme von neu errichteten Rechenzentren. Der Elchtest vom TÜV Rheinland simuliert verschiedene Störungen und Umschaltszenarien und nimmt währenddessen die betroffenen Komponenten aus Elektrotechnik, Kälteversorgung und Sicherheitstechnik ins Visier.

    Zum Beispiel mit dem Black-Building-Test, bei dem die Hauptstromzufuhr unterbrochen wird. Läuft der Notstrom automatisch an? Werden die Schaltvorgänge fehlerfrei durchgeführt? Und wechselt das System zurück in den Normalbetrieb, sobald der Hauptstrom wieder verfügbar ist? Lautet die Antwort auf eine dieser Fragen „nein“, besteht Handlungsbedarf. Ein weiterer Test: Fällt eine von zwei redundanten Klimaanlagen aus, muss die andere die vorgegebene Temperatur allein halten können. Schafft sie das nicht, gilt es dringend nachzubessern.

    Fehler frühzeitig aufdecken

    Mit dem Elchtest kann das Unternehmen frühzeitig Fehler im Rechenzentrum aufdecken, die bei einer herkömmlichen Inbetriebnahme unter Umständen verborgen bleiben und die sich später massiv auf den regulären Betrieb auswirken könnten. Willkommener Nebeneffekt: Das Personal des Rechenzentrum-Betreibers erhält ein effektives Training on the Job und kann seine Anlagenkenntnisse erweitern. Letztlich können die Tests vom TÜV Rheinland also dazu beitragen, mögliche Ausfallzeiten zu reduzieren und die Verfügbarkeit zu verbessern – und damit die Zukunftsfähigkeit des Unternehmens zu sichern.

    * Rolf Walter ist Seniorleiter des Teams Data Center Services im TÜV Rheinland in 51105 Köln, Tel. (01 76) 78 73 81 56, rolf.walter@de.tuv.com, www.tuv.com/consulting

    (ID:45373658)