Wenn das neue Elektroauto des Geschäftsführers die Produktion lahmlegt – und was das mit Server-Rechenleistung zu tun hat

Es klingt wie eine Anekdote, über die man später lachen kann.

Leider war es in diesem Unternehmen alles andere als lustig.

Der Geschäftsführer hatte sich ein neues Elektroauto gegönnt – ein Premium-Modell mit schneller Ladeleistung, umfangreicher Software und einer smarten Wallbox, die sich automatisch mit dem Firmennetz verbindet.

Alles modern.

Alles effizient.

Alles „State of the Art“.

Bis zu dem Tag, an dem plötzlich die Produktion einbrach.


1. Ein Produktionsproblem ohne erkennbare Ursache

An einem Montagmorgen zieht die Fertigungsleitung die Notbremse:

Maschinen reagieren verzögert.

Bestellungen werden nur halb verarbeitet.

Daten für den Materialfluss kommen zu spät an.

In den Logs häufen sich Timeouts.

Die Produktion fährt runter – nicht komplett, aber so stark, dass eine Schicht fast unbrauchbar wird.

Der Schaden: mehrere tausend Euro in wenigen Stunden.

Das Problem:

Alle Systeme sind „grün“.

Keine offensichtlichen Fehler.

Keine Server ausgefallen.

Keine Netzwerkstörung gemeldet.

Es gab keinen klassischen Auslöser – oder zumindest keinen, den man gesehen hätte.


2. Der erste Verdacht: ein Softwareproblem?

Die IT prüft:

  • CPU-Auslastung: normal
  • Netzwerk: keine Paketverluste
  • Speicher: ausreichend
  • Datenbank: kein Deadlock
  • Maschinenmeldungen: zufällig verteilt

Alles sieht okay aus.

Doch die Produktion läuft trotzdem nicht rund.

Ein Muster war nicht zu erkennen – bis man die Zeitstempel der Verzögerungen genauer betrachtete.

Immer wenn Anfragen aus dem Produktionssystem länger dauerten, stieg gleichzeitig die durchschnittliche Antwortzeit der zentralen API.

Nicht kritisch – aber ungewöhnlich.

Etwa so, als würde jemand immer wieder kurz die Rechenleistung wegziehen, dann wieder freigeben.


3. Die entscheidende Frage: Was passiert eigentlich ab 6:30 Uhr?

Nach einer Auswertung der Peaks fällt auf:

Die Anomalien beginnen jeden Tag zwischen 6:30 Uhr und 6:40 Uhr.

Punktgenau.

Jeden Tag.

Wie ein Timer.

Zu diesem Zeitpunkt kommt der Geschäftsführer regelmäßig ins Büro.

Und an diesem Tag wurde eine Beobachtung wichtig:

Er hatte seit Kurzem sein neues Elektroauto – und lädt es immer morgens an der brandneuen, smarten Firmen-Ladestation.


4. Die Ladestation als unabsichtlicher CPU-Killer

Die Wallbox war nicht irgendeine Wallbox.

Sondern ein „intelligentes“ System, das:

  • Lastmanagement betreibt
  • über APIs kommuniziert
  • Telemetrie-Daten überträgt
  • Energiedaten live ins Firmennetz streamt
  • Firmware-Updates automatisiert anfordert
  • Nutzerdaten regelmäßig synchronisiert

Kurz: eine kleine IoT-Maschine.

Was keiner wusste:

Die Wallbox sendete alle 500 Millisekunden Status-Updates und belastete dabei dauerhaft die gleiche API, die auch die Produktion nutzte.

Durch einen Konfigurationsfehler wurden diese Daten nicht an ein eigenes Backend übertragen, sondern an denselben Server, der die Produktionsdaten bereitstellt.

Resultat:

Ein einzelnes System – die Wallbox – erzeugte genug Kleinlast, um die Produktions-API in regelmäßigen Mikrospitzen an den Rand zu schieben.

Der Server war nicht „ausgelastet“, aber zu beschäftigt, um zeitkritische Produktionsanfragen zuverlässig zu beantworten.

Ein klassisches Beispiel für:

„Alles sieht gut aus – aber nichts läuft gut.“


5. Warum niemand das gesehen hat

Drei Gründe:

1. Es wurde nur das gemessen, was man erwartet hat

Die IT überwachte:

  • CPU
  • RAM
  • Netzwerk
  • Fehlerhäufigkeit
  • Systemverfügbarkeit

Nicht überwacht wurde:

  • API-Antwortzeiten nach Endpunkt
  • ungewöhnliche Zugriffsmuster
  • belastende Einzelgeräte im Netz
  • Zusammenhänge zwischen Maschinenzeiten und anderen Systemen

Monitoring ohne Businessbezug → blind für echte Ursachen.


2. Keine Trennung zwischen „Produktion“ und „Nebensystemen“

Die Wallbox war einfach „auch im Netz“ – ohne Priorisierung.

QoS?

Keine.

Segmentierung?

Minimal.


3. Niemand hätte vermutet, dass eine Ladestation überhaupt relevant ist

Ein typisches Muster:

Man überwacht, was „kritisch“ wirkt – Server, Netzwerke, Datenbanken.

Aber nicht:

eine Ladesäule.


6. Die Lösung: Priorisierung + Monitoring der API-Ebene

Es brauchte zwei Schritte:

Schritt 1: Netzsegmentierung und QoS

Die Ladestation wurde in ein eigenes VLAN verschoben.

Daten wurden gedrosselt, nicht mehr priorisiert.

Die API bekam eine höhere Priorität im Netzwerk.

Schritt 2: Monitoring auf Geschäftsprozessebene

Nicht nur technische Werte, sondern:

  • Antwortzeiten je Endpunkt
  • Anomalien im Zugriffsmuster
  • Trends über den Tag
  • Vergleich zwischen Produktionslast und externen Geräten
  • Heatmaps über kritische Zeitfenster

Erst das ermöglichte den Blick:

Warum stockt die Produktion – und was passiert sonst zur selben Zeit?

Das ist Business-Monitoring.

Nicht „Server grün“, sondern Systeme verstehen.


7. Was Unternehmen daraus lernen können

1. Jedes moderne Gerät ist ein Computer

Egal ob:

  • Ladestation
  • Zeiterfassung
  • Smart TV
  • Kaffeemaschine
  • IoT-Sensor
  • Türkontrolle

Alles erzeugt Daten.

Alles verursacht Last.

Alles kann Prozesse beeinflussen.


2. Segmentierung ist keine Option, sondern Pflicht

Ohne klare Netztrennung landet irgendwann alles auf allem.


3. Monitoring muss immer Geschäftsbezug haben

Nur technische Werte zu messen, reicht nicht mehr.

Du musst sehen:

  • Wie wirkt ein System auf Prozesse?
  • Wie wirkt Prozess A auf Prozess B?
  • Welche Systeme belasten dieselbe Schnittstelle?
  • Welche Trends wiederholen sich?

Wenn du nur misst, was das System macht,

aber nicht was dadurch im Unternehmen passiert,

bleibst du blind.


4. „Kleinkram“ ist oft der Grund großer Störungen

Ein einzelnes Gerät kann ein gesamtes System stören.

Insbesondere intelligente Geräte, die selbstständig synchronisieren, updaten oder Daten streamen.


Fazit: Moderne Störungen brauchen modernes Monitoring

Der Produktionsausfall war kein Serverproblem.

Kein Softwarefehler.

Kein Netzwerkausfall.

Er wurde ausgelöst durch:

das neue Elektroauto des Geschäftsführers.

Genauer: durch seine Ladestation.

In einer vernetzten Welt beeinflusst alles alles.

Und deshalb braucht Monitoring heute einen anderen Fokus:

Nicht: „Läuft der Server?“

sondern: „Läuft das Unternehmen?“

Wenn du wissen möchtest, wie du Monitoring so aufbaust,

dass du solche Zusammenhänge früh erkennst,

statt teuer hinterherzurennen:

📞 Buche dein kostenloses Erstgespräch.

Ich zeige dir, wie du aus Technik Übersicht und aus Übersicht Sicherheit machst.

➡️ https://rakosun.com/kontakt