Eine erste Klassifizierung

Wer sich die Kurvenverläufe genau anschaut, kann sehr schnell ein einfaches Unterscheidungskriterium der drei Szenarien ermitteln:

  1. Der Kompressor schaltet regelmäßig ein und aus -> Normalbetrieb bei Kühlung
  2. Der Kompressor läuft die ganze Zeit -> Auftreten eines Fehlerzustands
  3. Der Kompressor läuft nicht -> Normalbetrieb wenn keine Kühlung erforderlich ist

Die entscheidenden Attribute sind also die Frequenz des Statuswechsels des Kompressors und der Status des Kompressors (= Taktung).

Auf der Grundlage der Datenbasis lässt sich ein sogenannter Entscheidungsbaum erstellen. Im vorliegenden Beispiel habe ich dies zunächst mit dem Statistikwerkzeug R durchgeführt.

Eine vereinfachte Darstellung sieht wie folgt aus:

Um die Frage zu beantworten, welches Szenario (bei gegebenem Status und Änderungsverhalten des Status in den letzten 5 Minuten) gerade anliegt, werden die Äste gemäß der anliegenden Werte entlanggelaufen, bis man bei einem Blatt ankommt. Dieses liefert dann das vermutlich aktuell anliegende Szenario.

Bewertung der ersten Klassifizierung
Interessanterweise ist der aktuelle Status des Kompressors für den von mir gewählten Algorithmus ein besseres/aussagekräftigeres Entscheidungskriterium, als das Änderungsverhalten des Status – was meiner Intuition widerspricht.

  • Steht dies im Gegensatz zu den oben festgehaltenen beobachteten Zusammenhängen?
  • Wurde das neue mathematische Modell des Attributs, das die Informationen der „Frequenz“ beschreiben soll unpassend gewählt?
    • Ist die Wahl von 5 Minuten sinnvoll?
    • Was ist mit den Werten in den ersten Minuten? Diese zeigen keine Statusänderung, da keine Vorinformationen vorhanden sind. Sie gehören aber trotzdem zum Normalbetrieb bei Kühlung. Wie kann das Modell dies abbilden?
  • Sind die Eigenschaften des Entscheidungsbaums nicht passend gewählt?
  • Oder versteckt sich hier bereits eine Information, die im Vorhinein so nicht zu erwarten gewesen ist?

Wie gut ist denn eigentlich der oben dargestellte Baum?
Das Abzählen der Datensätze, die einem falschen Szenario zugeordnet wurden zeigt, dass

  • bei einer Klassifizierung anhand dieses Baums ca. bei 6% der Datensätze ein Fehler gemacht wird.
    • Bei dem Normalbetrieb mit Kühlung werden 13 % der Datensätze falsch zugeordnet
    • Ist die Kältemaschine im Fehlerzustand werden 3 % der Datensätze falsch zugeordnet
    • Bei dem Normalbetrieb ohne Kühlung werden 6 % der Datensätze falsch zugeordnet

Dafür dass wir bis jetzt nur mit sehr einfachen Mitteln gearbeitet haben und unsere Analyse auf Vermutungen stützen, ist dieses Ergebnis schon sehr zufriedenstellend. Wir sind also auf dem richtigen Weg.

Ziel ist, die Ergebnisse in den nächsten Schritten weiter zu verfeinern. Da hierbei mehr Kriterien einfließen, lässt sich dies aber ggf. nicht mehr so anschaulich darstellen.

Veröffentlicht in Digitalisierungsprozess

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*