- dirk-joedicke.de
- Blogbeitrag
Datenvisualisierung – Teil 1: Korrelationen erkennen
Nachdem sich die letzten beiden Blogbeiträge allgemein um die Grundbegriffe in der Statistik sowie Merkmale und Daten gedreht haben, wird es in diesem Beitrag konkreter: Denn um gesammelte Daten fachgerecht und korrekt zu analysieren, sind grafische Darstellungen unverzichtbar. Zur Prozessoptimierung mit SIX SIGMA ist Minitab® ein stetiger Begleiter. Dabei handelt es sich um eine bewährte Statistik-Software, die eine Vielzahl grafischer Werkzeuge und Methoden für die Datenanalyse bietet. Auf einige soll in den nächsten Blogbeiträgen eingegangen werden – beginnend mit Werkzeugen, um Korrelationen zu erkennen.
Was sind Korrelationen?
Im Rahmen der Statistik mit SIX SIGMA ist eine Korrelation ein Maß, das Aufschluss über den Zusammenhang zwischen zwei Variablen gibt. Sie zeigt, inwieweit zwei Variablen im Verhältnis zueinander stehen oder wie stark sie sich gegenseitig beeinflussen. Ein Beispiel aus der Fertigung ist der Zusammenhang zwischen der Nutzungsdauer einer Maschine und ihrer Ausfallwahrscheinlichkeit. Mithilfe verschiedener Minitab®-Werkzeuge kann die Wechselbeziehung analysiert werden, um präventive Wartungspläne zu entwickeln und Ausfälle künftig zu vermeiden.
Werkzeuge zur Erkennung von Korrelationen
Vier Methoden beziehungsweise Werkzeuge bieten sich an, um Korrelationen zu identifizieren und zu analysieren:
Streudiagramm:
Ein Streudiagramm ist ein grundlegendes Werkzeug zur Visualisierung der Beziehung zwischen zwei quantitativen Variablen und eine der häufigsten Datenvisualisierungen bei der Anwendung von SIX SIGMA. Jeder Punkt im Diagramm bildet ein Wertepaar: Die horizontale Achse stellt die unabhängige Variable und die vertikale Achse die abhängige Variable dar. Durch die Anordnung der Punkte lassen sich Muster, Trends oder auch mögliche Ausreißer erkennen. Folgen Punkte einem bestimmten Verlauf, können lineare/nicht lineare Korrelationen sichtbar werden, wodurch Streudiagramme besonders nützlich sind, um erste Hypothesen über Zusammenhänge und die Stärke der Beziehung zu entwickeln.

Matrixplot:
Mit einem Matrixplot werden mehrere Streudiagramme gleichzeitig angeordnet, um Beziehungen mehrerer Variablen zu analysieren. In jeder Zelle der Matrix befindet sich ein Streudiagramm für je ein Wertepaar aus zwei Variablen. Auf einen Blick können somit Korrelationen oder Muster erkannt werden, weshalb Matrixplots sich vor allem zur Bewertung und Identifikation der Zusammenhänge von einer Vielzahl an Variablen eignen. Ein Matrixplot ist eine intuitiv anwendbare Option, um komplexe Datensätze verständlich zu visualisieren und Beziehungen festzustellen.

Blasendiagramm:
Ein Blasendiagramm zeigt drei Dimensionen von Daten gleichzeitig und erweitert so das klassische Streudiagramm. Zusätzlich zur X- und Y-Achse mit quantitativen Variablen kommen Blasen, deren Größe eine dritte Variable repräsentiert. Das Blasendiagramm ist somit das Werkzeug der Wahl, wenn Zusammenhänge und Wechselbeziehungen zwischen drei Variablen gleichzeitig visualisiert werden sollen. Besonders nützlich ist diese Form des Diagramms, wenn neben der Beziehung zweier Variablen auch die Bedeutung einer dritten berücksichtigt werden soll – zum Beispiel, um neben dem Zusammenhang zwischen Produktionskosten und Produktqualität auch die Entwicklung der Verkaufszahlen (Blase) zu beobachten.

Randdiagramm:
Randdiagramme können als Kombination aus Streudiagramm und Histogramm definiert werden. Entlang der Ränder der X- und Y-Achse zeigen Randdiagramme zusätzlich zur Beziehung auch die Verteilung einzelner Variablen. Dadurch werden nicht nur Korrelationen erkennbar, sondern auch Streuung oder Ausreißer einzelner Variablen. So visualisieren sie sowohl die gemeinsame als auch individuelle Verteilung der Daten und liefern ein umfassendes Bild der Datenstruktur.

Datenvisualisierung – unerlässlich für SIX SIGMA
Mithilfe grafischer Werkzeuge und Methoden werden Datenanalysen anschaulich und auswertbar dargestellt – sodass SIX SIGMA-Teams Zusammenhänge schnell erkennen, bewerten und daraus wichtige Schlüsse für die Prozessoptimierung ziehen können. Bei Fragen zum diesem Thema helfe ich Ihnen gerne weiter.
Bild von freepik