Datenvisualisierung – Teil 3: Datensätze vergleichen

Wie vielseitig und bedeutend grafische Werkzeuge zur Datenvisualisierung in SIX SIGMA-Projekten sind, haben Sie bereits in Teil 1 und Teil 2 dieser Blogserie erfahren. Mit der Statistik-Software Minitab® lassen sich Datensätze auch schnell und präzise vergleichen, um Unterschiede sowie Gemeinsamkeiten zu erkennen und entsprechend zu interpretieren. Damit Zahlenkolonnen nicht mehr kryptisch bleiben, sondern in verständliche Bilder übersetzt werden können, wenden wir verschiedene grafische Werkzeuge an, die in diesem Beitrag kurz vorgestellt werden. Dabei hat jeder Diagrammtyp spezifische Stärken und geeignete Einsatzgebiete.

Warum Datensätze vergleichen?

Der Vergleich verschiedener Datensätze ist ein zentraler Bestandteil der Statistik und ausschlaggebend für datenbasierte Entscheidungen. Muster und Unterschiede werden klar erkennbar, Hypothesen können überprüft werden. Sowohl in der Forschung, im Marketing oder in der Qualitätskontrolle sind Vergleiche notwendig, um Entwicklungen zu bewerten und Optimierungspotenziale, auch im Rahmen von SIX SIGMA, aufzudecken. Ein einzelner Datensatz ist meist wenig aussagekräftig – erst im Kontext anderer Daten entfaltet er seine volle Bedeutung.

Grafische Werkzeuge zum Vergleich von Datensätzen

SIX SIGMA-Teams können mittels Minitab® verschiedene Methoden zur Datenvisualisierung anwenden, um Datensätze zu vergleichen:

Boxplot:

Der Boxplot – auch Box-Whisker-Plot – ist ein Klassiker der explorativen Datenanalyse. Anhand von fünf Kennzahlen (Minimum, unteres Quartil, Median, oberes Quartil und Maximum) kann ein Datensatz dargestellt und mit mehreren Gruppen verglichen werden. Auf einen Blick werden Auffälligkeiten wie Ausreißer oder Unterschiede in der Streuung sichtbar. Möchte man schnell erkennen, ob sich Mittelwerte oder die Verteilung verschiedener Datensätze ähneln oder unterscheiden, ist der Boxplot optimal.

Beispiel für ein Boxplot. Die Sternchen stellen mögliche Ausreißer dar.

Fehlerbalkendiagramm:

Mithilfe des Fehlerbalkendiagramms werden Mittelwerte mit Standardabweichungen oder Konfidenzintervallen (Wertebereich als Ergebnis von Intervallschätzungen) kombiniert. Das Fehlerbalkendiagramm ist anzuwenden, wenn Unterschiede zwischen Gruppen visualisiert und gleichzeitig die statistische Unsicherheit berücksichtigt werden sollen. Die Balken lassen sich mit Minitab® in verschiedenen Farben und Breiten anpassen, um visuell für mehr Klarheit zu sorgen. Nützlich ist dieses Diagramm zum Beispiel zur Überprüfung von Hypothesen in Bezug auf Mittelwertunterschiede, auch bei SIX SIGMA-Projekten.

Einzelwertdiagramm:

Das Einzelwertdiagramm zeigt jeden einzelnen Datenpunkt einer Gruppe. Besonders bei kleinen Stichproben ist es hilfreich – oder, wenn man die Streuung innerhalb der Gruppen genau betrachten möchte. Indem die Punkte nach Gruppen sortiert und mit Mittelwertlinien ergänzt werden, lassen sich Ausreißer oder in ihrer Verteilung ähnliche Gruppen schnell identifizieren. Das Einzelwertdiagramm ist empfehlenswert für Qualitätskontrollen, medizinische Studien oder auch Umfragen mit begrenzter Teilnehmerzahl – bei großen Stichproben ist es wenig informativ.

Liniendiagramm:

Zeitliche Entwicklungen oder auch Trends zwischen Datensätzen lassen sich mit dem Liniendiagramm gut vergleichen. In Minitab® können SIX SIGMA-Projektbeteiligte mehrere Linien in einem Diagramm darstellen und so den Vergleich zwischen Gruppen oder Bedingungen anschaulich machen. Besonders nützlich zeigt sich das Liniendiagramm bei Zeitreihenanalysen oder Produktionsverläufen mit mehreren Messzeitpunkten. Indem die Datenpunkte verbunden werden, zeigt sich ein klares Bild von Anstiegen, Abfällen oder Konstanten.

Visuelle Klarheit für datenbasierte Entscheidungen mit SIX SIGMA

Mit diesen Methoden zum Vergleich von Datensätzen lassen sich Unterschiede und Gemeinsamkeiten zwischen Gruppen leicht und mit wenigen Klicks aufdecken. Auch komplexe Daten werden durch die Visualisierung verständlich – für Analysten selbst ebenso wie für Entscheider. Haben Sie Fragen zur Datenanalyse mit Minitab®? Wenden Sie sich jederzeit gerne an mich.

 

Bild von rawpixel.com