Direkt zum Inhalt

Eine Vierfeldertafel oder Kreuztabelle ist ein Verfahren aus der beschreibenden Statistik, um die Zusammenhänge zwischen zwei statistischen Merkmalen darzustellen. Dazu schreibt man die jeweiligen relativen oder absoluten Häufigkeiten für die vier Fälle „beide Merkmale liegen vor“, „beide Merkmale liegen nicht vor“ und je eines liegt vor und das andere nicht. Wenn man die beobachteten Häufigkeiten als Schätzwerte für die Wahrscheinlichkeiten der entsprechenden Ereignisse und Gegenereignisse auffasst, kann man Aussagen über bedingte Wahrscheinlichkeiten. und die stochastische Unabhängigkeit der beiden Merkmale bzw. Ereignisse ableiten.

In der allgemeinen Form sieht die Vierfeldertafel wie folgt aus (die Endsumme 1 in der Zelle ganz unten rechts ergibt sich natürlich nur, wenn man relative Häufigkeiten aufträgt, andernfalls steht dort die Gesamtzahl aller Beobachtungen bzw. der Stichprobenumfang):

Merkmal \(B\) \(\bar{B}\) Summe
\(A\) \(h(A\cap B)\) \(h(A\cap \bar{B})\) \(h(A)\)
\(\bar{A}\) \(h(\bar{A}\cap B)\) \(h(\bar{A}\cap \bar{B})\) \(h(\bar{A})\)
Summe \(h(B)\) \(h(\bar{B})\) 1

 

Beispiel:

Beim Sehtest in einer Schule werden 1085 Jungen (J) und Mädchen (M) auf „Farbenblindheit“ (F) untersucht. Die folgende Vierfeldertafel dokumentiert das Ergebnis der Untersuchung:

Merkmal J M Summe
\(F\) 50 2 52
\(\bar{F}\) 550 483 1035
Summe 600 485 1085

Es wird nachfolgend die bedingte Wahrscheinlichkeit dafür berechnet (bzw. abgeschätzt), dass ein zufällig ausgewählter farbenblinder Schüler ein Junge ist. Aus den Häufigkeiten in der Tabelle erhält man für die bedingte Wahscheinlichkeit „Junge, wenn farbenblind“:

\(\begin{align}P(J \mid F)=P_F(J)&=\frac{P(J\cap F)}{P(F)}\\\\&=\frac{50}{1085}:\frac{52}{1085}\\\\&=\frac{50}{52}\approx 0,96 = 96\ \%\end{align}\)

 


Schlagworte

  • #Daten
  • #Statistik
  • #Häufigkeit