blikk info infothek forum galerie sitemap

Beschreibende Statistik
Deuten von Daten durch Streumaße (Spannweite, Quartilsabstand, Box-Plots, empirische Varianz, Standardabweichung)

anfang zurueck weiter ende nach oben


Tabellarische und grafische Darstellungen eines Datensatzes verändern den Informationsgehalt der Daten nicht oder kaum.
Lage- und Streumaße dagegen reduzieren die Aussagekraft eines Datensatzes auf wenige Zahlen.

Diese Reduktion der Information eines Datensatzes ist aber aus analytischen Gründen erwünscht.
Sie ist dann nützlich, wenn
ihr z.B. mehrere Datensätze miteinander vergleichen wollt.
 
     

 
     
Analyse der Daten
  Lagemaße ermöglichen die Beschreibung von ausgezeichneten Werten in einer geordneten Urliste. Jedoch können zwei solcher Rangwertreihen mit gleichem oder nahezu gleichen Mittelwert sehr unterschiedliche Streuungen um diesen Wert aufweisen. Streumaße machen daher eine ergänzende Aussage zu der im Lagemaß enthaltenen Information.
Beispiele für Lagemaße sind u.a. die (unterschiedlichen) Mittelwerte und die Quantile wie Median, Quartil und Percentil.
Beispiele für Streumaße sind u. a. die Spannweite, der Quartilsabstand und die empirische Varianz. Streumaße legen den Abstand zu Grunde. Daher sind diese Maße nur bei diskreten oder stetigen Merkmalsausprägungen sinnvoll.
     
Spannweite und Quartilsabstand
 

Streumaße charakterisieren das Abweichverhalten von zentralen Lagemaßen.
Die Spannweite einer Rangwertreihe (einer mit der Kleinerrelation geordneten Urliste) ist die Differenz aus dem größten und kleinsten Beobachtungswert, also aus dem Maximum und dem Minnimum der Rangwertreihe.
Der Quartilsabstand einer Rangwertreihe ist die Differenz aus dem oberen und unteren Quartil.
Siehe hierzu das Beispiel:
Quartile, Quartilsabstände und Spannweiten zur Körpergröße

   
Empirische Varianz und Standardabweichung
 

Zunächst werden für alle Beobachtungswerte die Abstände vom arithmetischen Mittel berechnet.
Die empirische Varianz berechnet sich als Quotient aus der Summe aller Abweichungsquadrate und der Anzahl der Beobachtungswerte.
Das Quadrieren der Abweichungen hat zur Folge, dass sehr kleine Abweichungen vom arithmetischen Mittel weniger als große ins Gewicht fallen. Von empirischer Varianz wird im Unterschied zum Varianzbegriff der Wahrscheinlichkeitsrechnung gesprochen.
Die Standardabweichung ist die positive Wurzel aus der empirischen Varianz.
Siehe hierzu das Beispiel:
Empirische Varianz und Standardabweichung bei der Körpergröße

     
Box-Plots
 

Box-Plots sind eine grafische Methode Lage- und Streumaße eines Datensatzes zu veranschaulichen. Box-Plots eignen sich insbesondere zum Vergleich von Datensätzen.
Die Lage- und Streumaße, die in Box-Plots verwendet werden, können unterschiedlich gewählt werden. Sehr häufig werden genutzt: das Minimum und Maximum, das untere und obere Quartil und der Median. Eine andere auch häufig vorkommende Form nutzt das Minimum und Maximum, das untere und obere Percentil, das untere und obere Quartil und den Median. Dies sind aber nur zwei Möglichkeiten.
Ein Box-Plot besteht aus einem Kasten (box) und zwei Strecken links und rechts (oder oben und unten) von dem Kasten. Eine Achse gibt an, welche Skalierung der Daten vorliegt.
Siehe hierzu das Beispiel:
Handyausgaben: Konstruktion von Box-Plots

     
 
     
Ideen für mögliche, selbstorganisierte
Übungen:
 
  • Führt eine Befragung oder eine Messreihe durch. Anregungen dazu findet ihr bei allen realen Problemen jeweils auf der Seite: "Gestaltet eine Befragung und wertet sie aus."
  • Bestimmt die für euch nützlichen Streumaße und fertigt auch Box-Plots an, wenn ihr zwei Datensätze miteinander vergleichen wollt.
Beispiele für Streumaße
 
nach oben