Bessere Noten mit Duden Learnattack Jetzt kostenlos testen
 

Stochastik, erweitertes Anforderungsniveau (2)


Aufgabe 7

a)

Schritt 1: Situation modellieren

Annahmen:

  • Es werden 100 Personen unabhängig voneinander befragt.
  • Auf die Frage, ob mindestens einmal im Monat ein Fahrrad genutzt wurde, gibt es genau 2 mögliche Antworten: „Ja“ und „Nein“.
  • Die Antwort ist bei jeder Befragung mit Wahrscheinlichkeit \(\frac{2}{3}\) „Ja“ und mit Wahrscheinlichkeit \(\frac{1}{3}\) „Nein“.

Die Anzahl X der Personen, die mit „Ja“ antworten, ist somit binomialverteilt zu den Parametern \(n=100\) und \(p=\frac{2}{3}\).

Wahrscheinlichkeit für E1  berechnen

Gesucht ist:

\(\text P(E_1)=\text P(X=70)\)

Die Bernoulli-Formel liefert:

\(\text P(X=70)=\left(\begin{array}{c}100\\70\end{array}\right)\cdot \left( \frac{2}{3}\right)^{70}\cdot\left(\frac{2}{3}\right)^{30}\approx 0{,}0673\)

Mit einer Wahrscheinlichkeit von etwa \( 6{,}7\text { }\%\) benutzen genau 70 der 100 Befragten ihr Fahrrad mindestens einmal im Monat.

Wahrscheinlichkeit für E2  berechnen

Gesucht ist:

\(\text P(E_2)=\text P(X\geq 70)=1-\text P(X \leq 69\)

In Tabelle 4 (kumulierte Binomialverteilung für \(n=100\)) wird \(1-\text P(X \leq 69)\) direkt angegeben: \(p=\frac{2}{3}\) ist in der unteren grau eingefärbten Zeile aufgelistet und in der rechten grau eingefärbten Spalte der Wert \(k=69\). Es ist also:

\(1-\text P(X\leq 69)\approx0{,}2766\)

Mit einer Wahrscheinlichkeit von ca. \(27{,}7\,\%\) benutzen mindestens  70 von den 100 Befragten ihr Fahrrad mindestens einmal im Monat.

Wahrscheinlichkeit für E3 berechnen

Gesucht ist

\(\text P(E_3)=\text P(60 \leq X \leq 70)= \text P(30 \leq Y \leq 40)=\text P(Y\leq40)-\text P(Y\leq29)\),

mit Y = Anzahl der Personen, die mit „Nein“ antworten; für diese Zufallsgröße ist \(p=\frac{1}{3}\).

Aus Tabelle 4 können die Werte \(\text P(Y\leq40)\approx0{,}9341\) und \(\text P(Y\leq29)\approx0{,}2093 \) entnommen werden. Demzufolge ist:

\(\text P(Y\leq40)-\text P(Y\leq29)=\text P(60 \leq X \leq 70)\approx 0{,}9341-0{,}2093=0{,}7248\)

Mit einer Wahrscheinlichkeit von ca. \(72{,}5\,\%\) benutzen mindestens 60 und höchstens 70 von 100 Befragten ihr Fahrrad mindestens einmal im Monat.

b)

Schritt 1: Situation modellieren

Annahmen: 

  • Es werden \(n\) Fahrräder unabhängig voneinander kontrolliert.
  • Für jede Fahrradkontrolle gibt es genau 2 mögliche Ausgänge: „Beanstandung“ und „keine Beanstandung“.
  • Die Wahrscheinlichkeit einer Beanstandung ist bei jeder Kontrolle \(\frac{1}{6}\).

Die Anzahl X der Beanstandungen ist somit binomialverteilt zu den Parametern n und \(p=\frac{1}{6}\).

Gesucht ist das kleinste \(n\in\mathbb{N} \) mit der Eigenschaft, dass \(\text{P}(X\geq1)\geq90\,\%\) gilt. Dabei ist:

\(\text P(X\geq1)=1-\text P(X=0)=1-{n\choose 0}\cdot\left(\frac{1}{6} \right)^0\cdot\left(\frac{5}{6}\right)^n=1-\left(\frac{5}{6}\right)^n\)

Die zu erfüllende Ungleichung lautet also:

\(\begin{align} 1-\left(\frac{5}{6}\right)^n\geq&0{,}9 &|& -0{,}9+\left(\frac{5}{6}\right)^n \\ \left(\frac{5}{6}\right)^n\leq&0{,}1 &|& \text{logarithmieren}\\ \ln\left(\left(\frac{5}{6}\right)^n\right)\leq&\ln0{,}1 &|& \text{Logarithmusgesetz anwenden}\\ n\cdot\ln\left(\frac{5}{6}\right)\leq&\ln(0{,}1) &|& \div\ln\left( \frac{5}{6}\right)\\ n\geq&\frac\ln0{,}1\ln\left(\frac{5}{6}\right)\approx12{,}63 \end{align} \)

 

Die kleinste natürliche Zahl mit dieser Eigenschaft ist 13.

Lösung

Um mit \(90\%\)iger Wahrscheinlichkeit mindestens ein Fahrrad mit Mängeln zu finden, müssen mindestens 13 Fahrräder kontrolliert werden.

c) (1)

Schritt 1: Wahrscheinlichkeit für Großstadtherkunft und Fahrradnutzung bestimmen

Bezeichnungen: 

= Person wohnt in Ort mit unter 20.000 Einwohnern
= Person wohnt in Ort mit 20.000 bis 100.000 Einwohnern
= Person wohnt in Ort mit über 100.000 Einwohnern
= Person nutzt regelmäßig ein Fahrrad
\(\overline{R}\) = Person nutzt nicht regelmäßig ein Fahrrad

Gesucht ist:
\(\text P(G\cap R)=\text(G)\cdot\text P_\text G(R)\)

Aus der Tabelle entnimmt man: \(\text P(G)=0{,}306;~\text P_\text G(R)=0{,}43\). Damit ist:

\(\text P(G\cap R)=0{,}306\cdot0{,}43=0{,}13158\)

Lösung

Mit einer Wahrscheinlichkeit von etwa \(13\,\%\) kommt eine Person aus einer Stadt mit mehr als 100.000 Einwohnern und benutzt regelmäßig ihr Fahrrad.

c) (2)

Schritt 1: Wahrscheinlichkeit für Großstadtherkunft unter der Voraussetzung nicht regelmäßiger Fahrradnutzung

Gesucht ist:

\(\text P_\overline{\text{R}}(G)=\frac{\text P(G\cap \overline R)}{\text P( \overline R)}\)

Es gilt: \(\text P_\text G(\overline R)=1-\text P_\text G(R)=1-0{,}43=0{,}57\)

Damit folgt:

\(\text P(G\cap \overline R)=\text P(G)\cdot \text P_\text G(\overline R)=0{,}306\cdot0{,}57=0{,}17442\)

Analog ist:

\(\begin{align} \text P(K\cap \overline R)=&\text P(K)\cdot\text P(K)\cdot\text P_\text K(\overline R)=0{,}404\cdot(1-0{,}37)&=&0{,}25452\\ \text P(K\cap \overline R)=&\text P(K)\cdot\text P(M)\cdot\text P_\text M(\overline R)=0{,}29\cdot(1-0{,}42)&=&0{,}1682 \end{align} \)

Nach der 2. Pfadregel ist:

\(\begin{align} \text P(\overline R)=&\text P(K\cap\overline R)+\text P(M\cap\overline R)+ \text P(G\cap\overline R)\\ =&0{,}25452+0{,}1682+0{,}17442\\ =&0{,}5971 \end{align} \)

Damit ist:

\(\text P_\overline{\text R}(G)=\frac{0{,}17442}{0{,}5971}=0{,}2921\)

Lösung

Mit einer Wahrscheinlichkeit von \(29{,}21\,\% \) kommt eine Person aus einer Großstadt, wenn sie nicht regelmäßig ein Fahrrad benutzt.

d)

Schritt 1: Mindestantrittsgebühr bestimmen

Annahmen

Aus der Erfahrung des Vorjahres wird extrapoliert, dass \(25\,\%\) der potenziellen Teilnehmer für das aktuelle Jahr das Rennen in der vorgegebenen Zeit schaffen. Die Zusammenstellung der 200 Teilnehmer für das diesjährige Rennen entspricht dann dem Modell „Ziehen ohne Zurücklegen“ aus der Menge der potenziellen Teilnehmer. Da aber die Zahl der potenziellen Teilnehmer vermutlich weitaus größer ist als 200, kann näherungsweise das Modell „Ziehen ohne Zurücklegen“ verwendet werden, d. h., die Anzahl X der Radfahrer, die einen Einkaufsgutschein bekommen, ist binomialverteilt zu den Parametern \(n=200\) und \(p=0{,}25\).

Abschätzung der Anzahl der Gewinner

Der Veranstalter muss mit \(95 \%\)iger Sicherheit abschätzen, wie viele Teilnehmer höchstens einen Einkaufsgutschein gewinnen. Er sucht also das kleinste k, sodass \(\text P(X\leq k)\geq 0{,}95\) ist.

Da X als binomialverteilt angenommen wird, hat X die Standardabweichung:

\(\sigma=\sqrt{n\cdot p\cdot(1-p)}=\sqrt{200\cdot0{,}25\cdot0{,}75} \approx6{,}12>3\)

Somit ist die Laplace-Bedingung erfüllt und es gilt daher nach den  \(\sigma\)-Regeln

\(\text P(X\leq\mu+1{,}64\sigma)\approx0{,}95\),

wobei \(\mu=n\cdot p =200\cdot0{,}25=50\) der Erwartungswert von X ist.

Somit ist \(\mu+1{,}64\sigma\approx60{,}04\). Um die \(95 \%\)ige Sicherheit nicht zu gefährden, wird der nächstgrößere ganzzahlige Wert verwendet: \(k=61\).

Der Veranstalter kann mit \(95\%\)iger Sicherheit damit rechnen, dass höchstens 61 Fahrradfahrer einen Preis gewinnen.

Mindeststartgebühr

Jeder der höchstens 61 Gewinner kostet den Veranstalter 20 €, d. h., er rechnet mit Ausgaben von höchstens \(61\cdot 20\,€=1220\,€\).

Die Einnahmen durch die Startgebühr belaufen sich auf \(200\cdot x\), wobei \(x\) die Startgebühr ist.

Es muss also gewährleistet sein, dass \(200\cdot x > 11220 \text{ €}\) ist, d. h., der Veranstalter muss mehr als
\(\frac{1220\,€}{200}=6{,}10\,€\) 
verlangen.

e) (1)

Schritt 1: Hypothesen bestimmen und begründen

Bestimmen der Hypothesen

Es bezeichne p den Anteil der Fahrräder mit Mängeln.

Mögliche Nullhypothesen sind:

entweder a) \(p<0{,}1\) („Weniger als \(10\,\% \) der Fahrräder weisen Mängel auf.“)

oder b) \(p\geq0{,}1\) („Mindestens \(10\,\%\) der Fahrräder weisen Mängel auf.“)

Die Anzahl X der bei der morgendlichen Kontrolle beanstandeten Fahrräder ist binomialverteilt mit Parametern \(n=200\) und unbekanntem \(p\).

Aus Tabelle 5 (kumulierte Binomialverteilung für \(n=200\)) entnimmt man für \( p = 0{,}1\) die kumulierten Wahrscheinlichkeiten \(\text P(X\leq12)\approx0{,}032\) sowie \(\text P(X\leq13)\approx0{,}0566\).

Das Signifikanzniveau ist die obere Schranke für die Wahrscheinlichkeit, die Nullhypothese irrtümlich zu verwerfen \( (\alpha = 0{,}05)\).

\(\text P(X\leq12) \) liegt gerade noch unterhalb dieser Schranke, die (noch unbekannte) Nullhypothese wird demnach für \(X \leq 12 \) verworfen.

Das Ergebnis \(X\leq12\) deutet darauf hin, dass der Anteil der zu beanstandenden Fahrräder klein ist, dass also \(p<0{,}1\) ist. Wenn in diesem Fall die Nullhypothese verworfen wird, dann muss sie lauten:

Nullhypothese \( \text H_0:~p\leq0{,}1\)

Gegenhypothese \(\text H_1:~p<0{,}1\)

Begründen der Hypothesenwahl

Das Signifikanzniveau ist die obere Schranke für den Fehler 1. Art (Wahrscheinlichkeit, die Nullhypothese irrtümlich zu verwerfen). Die Folgen eines Fehlers 1. Art sind

entweder a) Es wird davon ausgegangen, dass mindestens \(10\,\% \) der Fahrräder Mängel aufweisen, obwohl in Wirklichkeit weniger als \(10\,\%\) der Fahrräder zu beanstanden sind, d. h., die Kontrollen werden nicht reduziert, obwohl dies gerechtfertigt wäre

oder b) Es wird davon ausgegangen, dass höchstens \(10\,\%\) der Fahrräder Mängel aufweisen, obwohl in Wirklichkeit mehr als \(10\,\%\) der Fahrräder zu beanstanden sind, d. h., die Kontrollen werden ungerechtfertigterweise reduziert. 

Im Fall a) würde die Polizei unnötigerweise auf Ressourcenersparnis verzichten. Im Fall b) wäre die Verkehrssicherheit gefährdet. Es ist also aus Sicht der Polizei sinnvoller, die Wahrscheinlichkeit des Fehlers 1. Art im Fall b) gering zu halten, weswegen \(p\geq0{,}1\) als Nullhypothese gewählt wurde.

e) (2)

Schritt 1: Wahrscheinlichkeit für einen Fehler 1. Art

Im „verdoppelten“ Test erfolgt nach dem Beschluss der Polizisten ein Fehler 1. Art, wenn höchstens 25 defekte Fahrräder gefunden werden, obwohl tatsächlich mindestens \(10\,\%\) der Räder defekt sind. Die Wahrscheinlichkeit für einen Fehler 1. Art ergibt sich also als \(\text P(Y\leq25)\), wenn Y die Anzahl der beanstandeten Fahrräder ist. Y ist binomialverteilt mit Parametern \(n=400\) und unbekanntem \(p\).

Aus Tabelle 6 (kumulierte Binomialverteilung für \(n=400;~p=0{,}1\)) entnimmt man den Wert:

\(\text P(Y\leq25)\approx0{,}0054\Rightarrow\frac{\text P(Y\leq25)}{P(X\leq12)}\approx\frac{]0{,}0054}{0{,}032}=0{,}16875<0{,}2\)

Damit ist die Wahrscheinlichkeit, in dem neuen Test einen Fehler 1. Art zu begehen, auf weniger als ein Fünftel der ursprünglichen Fehlerwahrscheinlichkeit gesunken.

e) (3)

Schritt 1: Zeigen, dass \(\sigma_{400}=\sqrt{2}\cdot\sigma_{200} \)

Die Standardabweichung einer binomialverteilten Zufallsgröße mit Parametern \(n\) und \(p\) berechnet sich gemäß der Formel
\(\sigma=\sqrt{n\cdot p \cdot (1-p)}\).

Demnach ist:

\(\sigma_{200}=\sqrt{200\cdot p \cdot (1-p)}=\sqrt{200}\cdot\sqrt{p \cdot (1-p)}\)

Und:

\(\begin{align} \sigma_{400}=&\sqrt{400\cdot p \cdot (1-p)}\\ =&\sqrt{400}\cdot\sqrt{p\cdot (1-p)}\\ =&\sqrt{2\cdot 200}\sqrt{p\cdot(1-p)}\\ =&\sqrt{2}\left(\sqrt{200}\cdot\sqrt{p\cdot(1-p)}\right)\\ =&\sqrt{2} \cdot \sigma_{200} \end{align} \)

Auswirkung auf den Annahmebereich erläutern

Der Annahmebereich der Nullhypothese \(\text H_0:~p\geq0{,}1\) bei einer Stichprobe der Länge \(n\) ist die Menge aller möglichen Ergebnisse \(k\) des Experiments \(X_n\), die zur Annahme von \(\text H_0 \) führen. Dieser Bereich hat die Form:

\(\{k_0+1;k_0+2;\ldots;n\}\) für ein \(k_0\in\mathbb{N}_0\)

Der kritische Wert \(k_0\) wird näherungsweise mit den \(\sigma\)-Regeln bestimmt. Um nämlich das Signifikanzniveau von \(\alpha=0{,}05 \) zu halten, muss die Anzahl \(X_n\) der beanstandeten Fahrräder mindestens mit Wahrscheinlichkeit \(1-\alpha=0{,}95\) im Annahmebereich liegen, d. h., es muss \(\text P(X_n\geq k_0+1)\geq0{,}95\) gelten.

Nun gilt nach den \(\sigma\)-Regeln:

\(\text P(X_n\geq\mu_n-1{,}64\sigma_n)\approx0{,}95\), d. h., \(k_0 \) wird so gewählt, dass \(k_0+1\) die größte ganze Zahl mit \(k_0+1\leq\mu_n-1{,}64\sigma_n\) ist. Notation:
\(k_0+1=\lfloor\mu_n-1{,}64\sigma_n\rfloor\).

Durch den Übergang von \(n=200\) auf \(n=400\) wird also unter Beibehaltung des Signifikanzniveaus aus dem Annahmebereich

\(\{\lfloor\mu_{200}-1{,}64\sigma_{200}\rfloor;\ldots;200,\}\)

der Annahmebereich:

\(\{\lfloor\mu_{400}-1{,}64\sigma_{400}\rfloor;\ldots;200\}= \{\lfloor 2\mu_{200}-1{,}64\sqrt{2}\sigma_{200}\rfloor;\ldots;200\}\)

Die linke Grenze des Annahmebereichs wird also nicht nur zu \(2k_0+2 \) verdoppelt, sondern es wird noch \(1{,}64(2-\sqrt{2})\sigma_{200}\) addiert. Der Annahmebereich fällt somit kleiner aus als bei der Strategie der Polizei. Durch die Wahl eines für das vorgegebene Signifikanzniveau unnötig großen Annahmebereichs ist die Wahrscheinlichkeit des Fehlers 2. Art gestiegen, d. h., es wird möglicherweise keine Reduktion der Kontrollen vorgenommen, obwohl der Anteil mangelhafter Fahrräder unter \(10 \text{ }\%\) gesunken ist.

Die Lösungsvorschläge liegen nicht in der Verantwortung des jeweiligen Kultusministeriums.
Registriere dich, um den vollen Inhalt zu sehen!

VERSTÄNDLICH

PREISWERT

ZEITSPAREND

Weitere Mathethemen findest du hier

Wähle deine Klassenstufe

Weitere Musterlösungen findest du hier