Direkt zum Inhalt

Der Korrelationskoeffizient r ist ein Maß dafür, wie gut eine mit linearer Regression berechnete Ausgleichsgerade die experimentellen Werte beschreibt. Für zwei Zufallsgrößen X und Y, für die bei einer Messung die n Wertepaare (xi; yi) bestimmt wurden, gilt die Formel

\(\displaystyle r = \frac{ \sum_{i=1}^n ( x_i - \bar{x} )( y_i - \bar{y} ) }{ \sqrt{ \sum_{i=1}^n ( x_i - \bar{x} )^2 \cdot \sum_{i=1}^n ( y_i - \bar{y} )^2 } }\)

Dabei sind \(\bar{x}\) und \(\bar{y}\) die arithmetischen Mittelwerte der xi bzw. yi.

Das Quadrat des Korrelationskoeffizienten ist das Bestimmtheitsmaß r2. Während die Werte von r zwischen –1 und +1 liegen, liegt r2 zwischen 0 und +1. Generell gilt, dass für eine „gute“ Korrelation r bzw. r2 nahe bei \((\pm)1\) liegen müssen. r = 0,5 bedeutet beispielsweise, dass ein linearer Zusammenhang zwischen den x- und y-Werten eher unwahrscheinlich ist.


Schlagworte

  • #beurteilende Statistik
  • #Regressionsrechnung