- dirk-joedicke.de
- Blogbeitrag
Wenn Daten aus der Reihe tanzen: Ausreißer in SIX SIGMA verstehen
Wer sich mit Datenanalysen in SIX SIGMA-Projekten beschäftigt, kommt an ihnen nicht vorbei: Ausreißer. Sie scheinen zu „stören“ und fügen sich nicht in die sonst so gleichmäßige Datenvisualisierung ein – das ist auch gut so, denn Ausreißer können wertvolle Hinweise auf Prozessprobleme, besondere Ereignisse, fehlerhafte Einstellungen oder Sonderfälle liefern. In diesem Beitrag schauen wir uns an, wie man Ausreißer erkennt, was sie bedeuten und wie man sie mithilfe von statistischen Tests untersucht.
Was ist ein Ausreißer in SIX SIGMA?
In der Datenanalyse bei Prozessoptimierungen mit SIX SIGMA versteht man Ausreißer als Datenpunkte, die deutlich außerhalb des typischen Wertebereichs liegen. Sie tanzen buchstäblich aus der Reihe und bringen die eigentlich geordnete statistische Analyse auf den ersten Blick durcheinander. SIX SIGMA-Teams, die sich die Optimierung von Prozessen und die Reduktion von Fehlern zur Aufgabe machen, sollten Ausreißer erkennen und verstehen. Sie entsprechen nicht den Erwartungen, liegen also außerhalb eines zuvor definierten Streubereichs.
Ausreißer können ...
... nicht wiederholt werden.
... nicht vorausgesagt werden.
... durch Störungen und Fehler entstehen.
Wann ist ein ungewöhnlicher Datenpunkt ein Ausreißer?
Eines der einfachsten Werkzeuge zur Datenanalyse und Erkennung von Ausreißern in SIX SIGMA ist der Box-Whisker-Plot. Hier gilt die sogenannte 1,5-IQR-Regel:
IQR (Interquartilsabstand) = Q3−Q1
Grenzen für Ausreißer:
- Untere Grenze: Q1 − 1,5 × IQR
- Obere Grenze: Q3 + 1,5 × IQR
Alle Werte, die außerhalb dieses Bereichs liegen, sind potenzielle Ausreißer.
Mit Hypothesentests genauer hinschauen
Neben der Einschätzung potenzieller Ausreißer mittels Box-Plot lassen sich ungewöhnlich große oder kleine Werte, die im Rahmen eines SIX SIGMA-Projekts ermittelt wurden, auch durch Hypothesentests genauer analysieren. Zu den bewährtesten Tests zählen die Methoden von Gubbs und Dixon, um Ausreißer auch statistisch zu bestätigen.
Wichtig zu wissen: Wird in einer Stichprobe mehr als ein Ausreißer vermutet, ist möglicherweise weder der Gubbs- noch der Dixon-Test tatsächlich aussagefähig.
Test nach Gubbs: Klassiker für Normalverteilungen
Unter der Voraussetzung normalverteilter Daten prüft der Gubbs-Test, ob der extremste Wert einer Stichprobe ein Ausreißer ist. Er eignet sich vor allem, wenn bisher nicht klar ist, ob die Daten Ausreißer enthalten oder nicht.
- Nullhypothese (H₀): Es gibt keine Ausreißer.
- Alternativhypothese (H₁): Es gibt mindestens einen Ausreißer.
Der Test berechnet einen speziellen Wert (G), der mit einem kritischen Wert verglichen wird. Liegt G darüber, wird die Nullhypothese verworfen – und der Ausreißer ist statistisch bestätigt.
Test nach Dixon: Optimal für kleine Stichproben
Mit dem Dixon-Test lassen sich vor allem wenige Datenpunkte gut analysieren. Mithilfe des Tests prüfen SIX SIGMA-Teams, ob der größte oder kleinste Wert in einer sortierten Datenreihe ein Ausreißer ist. Dabei verwendet der Test den Parameter rij als Indikator:
- „i“ gibt die Anzahl der extremen Werte auf der Seite der Daten an, auf der der Ausreißer vermutet wird – zum Beispiel 1 oder 2.
- „j“ gibt die Anzahl der extremen Werte auf der entgegengesetzten Seite an – zum Beispiel 0, 1 oder 2.
Auch hier wird ein Verhältniswert berechnet und mit einer Tabelle verglichen. Der Test ist einfach und schnell – perfekt für erste Analysen.
Sind Ausreißer immer schlecht?
In SIX SIGMA sollten Ausreißer nicht als Störenfriede betrachtet werden, sondern vielmehr als wertvolle Hinweise auf Prozessabweichungen, Trends oder Verbesserungspotenziale. Ausreißern sollte man daher immer nachgehen und prüfen, ob die ungewöhnlichen Werte aufgrund von Messfehlern entstanden sind. Sind die zum Ausreißer gehörenden Teile noch vorhanden, kann eine Wiederholungsmessung Klarheit schaffen. Werden eindeutige Messfehler festgestellt, müssen die entsprechenden Ausreißer aus dem Datensatz entfernt werden. Vermutete Ausreißer, die sich bei der Wiederholungsmessung bestätigen lassen, sind tatsächlich keine Ausreißer, sondern echte Messwerte. Solche scheinbaren Ausreißer müssen hinterfragt werden – und sie sind Gold wert, da sie zu einem tieferen Verständnis des Prozesses beitragen. Ausreißer dürfen keineswegs „einfach so“ aus dem Datensatz entfernt werden, denn das wäre Datenmanipulation.
In meinen Trainings sage ich oft: Das Erscheinen von ungewöhnlichen Beobachtungen muss ernst genommen werden. Wenn man ausschließen kann, dass die ungewöhnlichen Beobachtungen Ausreißer sind, dann lassen wir die Sektkorken knallen, da es dann Potential zur Optimierung gibt. Die Praxis sieht leider anders aus: Potentielle Ausreißer werden viel zu schnell gelöscht, womit eine Chance zur Prozessoptimierung vergeben wird.
Haben Sie Fragen zum Thema? Wenden Sie sich gerne an mich.
Bild von freepik