beurteilende Statistik – Lernwege
beurteilende Statistik – Lexikoneinträge
-
Ein Alternativtest ist ein Hypothesentest ( Signifikanztest ), bei bei dem zwischen zwei konkreten Werten für die infragestehende Wahrscheinlichkeit p ( Hypothesen H 1 und H 2 ) entschieden werden soll. Es wird also nicht wie sonst bei statistischen Tests geprüft, ob eine bestimmte Nullhypothese abgelehnt werden kann oder nicht. Dementsprechend wird für beide Hypothesen je ein Annahme- und Ablehnungsbereich formuliert. Beispiel Eine Firma fertigt an zwei Maschinen Schrauben. Bei der Maschine A halten erfahrungsgemäß 10 der produzierten Stücke die geforderten Toleranzen nicht ein...
-
Bei einer linearen Regression diejenige Gerade , welche am besten mit den Messwerten verträglich ist bzw. die Abstände zwischen Datenpunkten und Punkten auf der Geraden minimiert. Es ist oft auch möglich, durch „Augenmaß“ eine recht gute Ausgleichsgerade zu zeichnen und daraus Steigung und Achsenabschnitt abzulesen. Eine lineare Regression liefert jedoch exakte Werte für Steigung und Achsenabschnitt und dazu mit dem Korrelationskoeffizienten r bzw. dem Bestimmtheitsmaß r 2 ein Maß dafür, wie wahrscheinlich es ist, dass zwishcen den Daten tatsächlich ein linearer Zusammenhang besteht. Beispiel...
-
In der beurteilenden Statistik wird von den Daten einer geeignet aufbereiteten Stichprobe ( beschreibende Statistik ) auf die Eigenschaften der zugrundeliegenden Grundgesamtheit geschlossen. Sie ist ein Teilgebiet der Stochastik . Ihre wichtigsten Aufgaben sind das Schätzen von Parametern wie dem Erwartungswert oder der Varianz und das Testen von Hypothesen . Der Schluss von der Stichprobe auf die Grundgesamtheit, die zu groß ist, als dass man sie vollständig „durchmessen“ könnte, ist immer mit Unsicherheiten behaftet. Darum sind die Aussagen der beurteilenden Statistik immer...
-
Ein Hypothesentest oder Signifikanztest prüft anhand eines Zufallsexperiments (einer Stichprobe), ob eine Hypothese, also eine bestimmte Annahme über eine Wahrscheinlichkeit p zutrifft oder nicht. Das Risiko einer Fehlentscheidung soll dabei unter einer bestimmten Schwelle, dem sog. Signifikanzniveau liegen. Beispiel: Es wird angenommen, dass eine Münzwurf fair ist, also p = P („Kopf“) = \(\frac{1}{2}\) . Der Test besteht dann darin, die Münze z. B. 100-mal zu werfen. Fällt ungefähr 50-mal „Kopf“, nimmt man die Hypothese an. Die wesentliche Aufgabe beim Test ist nun zu bestimmen, wie weit das...
-
Das Konfidenz - oder Vertrauensintervall ist bei der Schätzung von statistischen Parametern ein Bereich um den Schätzwert, in dem sich der wahre Parameterwert mit einer vorgegebenen Wahrscheinlichkeit (dem Konfidenzniveau ) befindet. Beispiel: Es wird der Erwartungswert \(\mu\) der Körpergröße aller Einwohner einer Stadt anhand einer statistischen Erhebung geschätzt. Die Schätzung ergibt, dass mit 95%iger Wahrscheinlichkeit die mittlere Körpergröße in der Stadt bei 1,78 \(\pm\) 0,05 m liegt. Der Schätzwert ist dann 1,78 m, das Konfidenzintervall ist das abgeschlossene Intervall [1,73 m; 1,83...
-
Der Korrelationskoeffizient r ist ein Maß dafür, wie gut eine mit linearer Regression berechnete Ausgleichsgerade die experimentellen Werte beschreibt. Für zwei Zufallsgrößen X und Y , für die bei einer Messung die n Wertepaare ( x i ; y i ) bestimmt wurden, gilt die Formel \(\displaystyle r = \frac{ \sum_{i=1}^n ( x_i - \bar{x} )( y_i - \bar{y} ) }{ \sqrt{ \sum_{i=1}^n ( x_i - \bar{x} )^2 \cdot \sum_{i=1}^n ( y_i - \bar{y} )^2 } }\) Dabei sind \(\bar{x}\) und \(\bar{y}\) die arithmetischen Mittelwerte der x i bzw. y i . Das Quadrat des Korrelationskoeffizienten ist das Bestimmtheitsmaß r 2...
-
Die lineare Regression ist eine statistische Methode, um die Daten aus einer Stichprobe oder einem Experiment durch eine angenommene lineare Funktion zu beschreiben. Den Graphen dieser Funktion nennt man auch Ausgleichsgerade . Es gibt einfache grafische Verfahren, um eine gute Näherung einer solchen Gerade zu bekommen. Rechnerisch lassen sich dagegen exakte Werte von Steigung m und Achsenabschnitt b derjenigen Geraden y = mx + b ermitteln, die am besten zu den Daten passt. „Passen“ bedeutet dabei, dass die über alle Datenpunkte summierte Abweichung minimal werden soll. In der Schule...
-
In der beurteilenden Statistik ist eine Prognose die Schätzung eines Parameters aufgrund der bekannten Werte einer Stichprobe . Dabei ist es möglich, Maßzahlen für die Güte der Prognose zu erhalten, sodass man beurteilen kann, wie zuverlässig die gemachte Prognose ist. Auch in der Analysis spricht man manchmal von Prognosen, wenn eine Entwicklung, z. B. eine Bevölkerungszahl oder ein Kontostand, mit einer Zeitfunktion modelliert und auf diese Weise ein „zukünftiger“ Funktionswert berechnet wird.
-
Eine Regressionsrechnung, bei der anders als bei der linearen Regression eine quadratische Funktion an die Messdaten angepasst wird.
-
Anderer Ausdruck für Hypothesentest . Die Bezeichnung kommt daher, dass man nach signifikanten, also nicht rein zufälligen Abweichungen von einer Annahme (der „Nullhypothese“) sucht.
-
Die Varianz ist ist eine Größe, mit der sich stochastische Verteilungen charakterisieren lassen. Man unterscheidet dabei zwei Fälle: Statistik: Die Varianz einer empirischen Stichprobe vom Umfang n , zur Verdeutlichung auch Stichprobenvarianz genannt, ist definiert als \(\displaystyle s^2 = \frac{1}{n - 1} \cdot \sum_{i=1}^n ( x_i - \overline{x} )^2\) dabei ist \(\bar x\) der empirische Mittelwert der Stichprobenwerte. Die Stichprobenvarianz ist ein häufig verwendetes empirisches Streuungsmaß . Achtung: Diese Definition mit „ n – 1“ im Nenner wird manchmal auch „ korrigierte...
-
Eine andere Bezeichnung für das Konfidenzintervall einer statistischen Parameterschätzung .