Grundbegriffe der Statistik: ein Überblick

Die wettbewerbsintensive Geschäftswelt lässt keine Fehler zu, wenn Unternehmen zum namhaften Player am Markt werden und es auch bleiben möchten. Die Produktqualität ist einer der wichtigsten Erfolgsfaktoren, weshalb nicht nur große, sondern auch mittelständische und kleine Unternehmen immer häufiger auf datengestützte Methoden wie SIX SIGMA setzen, um Prozesse zu optimieren und Ausschuss zu reduzieren. Um Prozesse messbar, kontrollierbar und vor allem verbesserbar zu machen, braucht es Statistik. Hier sollen einige der wichtigsten statistischen Grundbegriffe vorgestellt werden – herausgegriffen aus einem Themenfeld, das ebenso vielseitig wie spannend ist.

Was ist Statistik?

Einfach gesagt: Als Statistik wird die Wissenschaft von der Erfassung, Analyse, Interpretation und Präsentation von Daten bezeichnet. In der Qualitätssicherung und innerhalb der SIX SIGMA Methodik dient sie zum Verständnis von Prozessen und hilft, Abweichungen zu erkennen, um entsprechend fundierte Entscheidungen für Optimierungen zu treffen.

Als Teilgebiet der Mathematik wird die Statistik in verschiedensten Bereichen eingesetzt und ermöglicht es, Zusammenhänge zwischen Daten und Variationen zu erkennen und möglicherweise sogar vorauszusehen. Nicht ohne Grund ist die Statistik ein eigenes Studienfach und fasziniert durch ihre Komplexität. Die Erklärung der wichtigsten Grundbegriffe soll einen ersten Überblick geben, der gerne in einer speziellen Schulung vertieft werden kann.

Die wichtigsten Grundbegriffe der Statistik zur Anwendung in SIX SIGMA

  • Grundgesamtheit: Die Grundgesamtheit, auch Population, bezeichnet die Menge aller Einheiten mit übereinstimmendem Identifikationsmerkmal, die untersucht werden sollen – zum Beispiel alle im Jahr 2024 in einem Werk produzierten Isoliergläser oder Autotüren. Wichtig: Die Grundgesamt ist meist eine sehr große Menge – sie muss genau definiert werden, sodass sie ausschließlich relevante Elemente enthält.
  • Stichprobe: Diese Teilgesamtheit beinhaltet eine bestimmte Gruppe von Objekten oder Personen aus der Grundgesamtheit. Sie dient dazu, auf Eigenschaften der Grundgesamtheit zu schließen, ohne die gesamte Menge untersuchen zu müssen. Sie stellt demnach einen Kompromiss zwischen Aufwand und Genauigkeit dar und muss repräsentativ sein. Dabei gilt: Je größer die Stichprobe, desto genauer das Ergebnis – und desto größer der Aufwand.
  • Stichprobenfehler: Zu einem Stichprobenfehler kommt es, wenn die gewählte Stichprobe nicht die Eigenschaften der Grundgesamtheit abbildet. Dabei kann es sich um einen zufälligen Fehler handeln, der durch natürliche Schwankungen beim Festlegen der Stichprobe entsteht und durch Wiederholungen oder größere Stichproben beseitigt werden kann. Auch kann es zu einem systematischen Fehler durch Verzerrungen im Auswahlverfahren kommen, wenn nur bestimmte Gruppen untersucht werden. Dies führt zu dauerhaft falschen Ergebnissen.
  • Merkmal, Ausprägung, Skala: Ein Merkmal bezeichnet eine beobachtbare Eigenschaft einer Einheit (z. B. Größe, Farbe, Leitfähigkeit etc.). Die Ausprägung benennt den konkreten Wert des Merkmals, während Skalen zeigen, wie die Merkmalausprägung gemessen werden kann:
    • Nominalskala: unterscheidet zwischen Kategorie, lässt die Rangfolge außer Acht.
    • Ordinalskala: ordnet Werte mit Rangfolge, aber nicht quantifizierbar.
    • Intervallskala: misst mit gleichen Abständen, aber ohne festgelegten Nullpunkt.
    • Verhältnisskala: ergänzt die Intervallskala um einen fest definierten Nullpunkt.
  • Mittelwert: Der Mittelwert als arithmetisches Mittel aller Messwerte ist ein statistisches Maß für den durchschnittlichen Wert der untersuchten Datengruppe. In SIX SIGMA ist er bedeutend, um zu erkennen, ob ein Prozess im Sollbereich liegt.
  • Median: Unter dem Median versteht man den mittleren Wert einer geordneten Datenreihe, der die Messwerte somit in zwei Hälften unterteilt. Er ist robuster gegenüber Ausreißern als der Mittelwert.
  • Standardabweichung: Sie bezeichnet die Streuung der Daten um den Mittelwert. Je geringer die Standardabweichung ausfällt, desto enger liegen die Daten beieinander und desto stabiler ist der Prozess.
  • Spannweite: Die Spannweite ist der Abstand zwischen dem größten und dem kleinsten Wert im Datensatz.
  • Quartil, Quartilsabstand: Quartile teilen die sortierten Messdaten in vier gleich große Teilgesamtheiten. Der Quartilsabstand (QA) zeigt die Differenz zwischen dem dritten und ersten Quartil und gibt dadurch die Spannweite der mittleren 50 Prozent der Daten an.

Nochmal zu den Merkmalen ...

... denn mit ihnen steht und fällt die Statistik. Welche Arten von Merkmalen gibt es, was sind stetige und diskrete Daten und warum sollte man attributive Daten nach Möglichkeit in metrische Daten umwandeln? Das wollen wir im nächsten Blogbeitrag näher betrachten.

Bei Fragen stehe ich gerne zur Verfügung.

 

Bild von Gerd Altmann auf Pixabay