Direkt zum Inhalt

In der beschreibenden Statistik ist eine Stichprobe eine Teilmenge der untersuchten Grundgesamtheit. Da man z. B. vor einer Bundestagswahl nicht alle Wahlberechtigten nach ihren Ansichten befragen kann, wählt man eine Stichprobe von z. B. 2000 Personen aus, bei denen die sog. Ausprägungen von statistischen Merkmalen wie „bevorzugte Partei“ oder „wichtigstes politisches Thema" ermittelt werden. Man kann die Anzahl der Ausprägungen eines bestimmten Merkmals entweder als absolute oder als relative Häufigkeit angeben. Die Gesamtzahl der Elemente einer Stichprobe nennt man ihren Umfang, im obigen Beispiel hätte die Stichprobe den Umfang n = 2000.

Um aus einer Stichprobe verlässliche Schlüsse auf die Grundgesamtheit ziehen zu können, muss die Stichprobe repräsentativ sein. Dies lässt sich z. B. dadurch erreichen, dass der Stichprobenumfang groß genug gewählt und die Elemente der Stichprobe (etwa die Befragten einer Meinungsumfrage) rein zufällig ausgewählt werden (Zufallsstichprobe).

Auch bei Hypothesentests spielen Stichproben eine wichtige Rolle, da dort anhand einer Stichprobe entschieden wird, ob die aufgestellte Hypothese angenommen oder abgelehnt werden sollte.

Um eine Stichprobe, also etwa eine Meinungsumfrage oder eine Zufallsauswahl von Industrieprodukten, statistisch untersuchen zu können, ist zuerst eine Aufbereitung der Stichprobenwerte erforderlich. Diese sind dabei zunächst in Form einer sogenannten Urliste gegeben.

Beispiel: untersuchtes Merkmal ist das Alter der Schüler eines Kurses

Urliste: \(17, 17, 19, 18, 17, 18, 19, 18, 18, 17, 20, 18, 17, 19, 17, 16, 19, 18, 18, 18.\)
Menge der Merkmalsausprägungen: \(S = \{16; 17; 18; 19; 20\}.\)
Die n = 20 Stichprobenwerte haben 5 Merkmalsausprägungen.

Die einfachste Aufbereitung der durch die Urliste gegebenen Stichprobenwerte ist die Strichliste, aus der sich die absoluten und relativen Häufigkeiten bestimmen lassen (dies geht natürlich auch genauso gut mit einer Tabellenkalkulation oder einem Taschenrechner).

Bei Merkmalsausprägungen, die mit mindestens einer Ordinalskala gemessen werden, kann man die Summe der Häufigkeiten für die ersten j Stichprobenwerte bilden, man nennt diese die Summenhäufigkeit oder kumulative Häufigkeit.

Am Ende der Datenaufbereitung haben die Daten eine Form, in der man ein statistisches Diagramm erstellen oder die Daten mit den Methoden der beurteilenden Statistik (z. B. Schätzen von statistischen Parametern oder Hypothesentests) weiter analysieren kann.


Schlagworte

  • #beschreibende Statistik