51  Lösungen kontinuierliche Wahrscheinlichkeitsverteilungen

Hier finden Sie die Lösungen zu den Übungsaufgaben von Abschnitt 44.7.

Die hier vorgestellten Lösungen stellen immer nur eine mögliche Vorgehensweisen dar und sind sicherlich nicht der Weisheit letzter Schluss. In R führen viele Wege nach Rom, und wenn Sie mit anderem Code zu den richtigen Ergebnissen kommen, dann ist das völlig in Ordnung.

51.1 Lösung zur Aufgabe 44.7.1

a) Plotten Sie die Dichtefunktion der Wartezeit.
# x-Werte
x <- seq(-1, 16, by=0.1)
# Dichtefunktion der Uniformverteilung für alle x
y <- dunif(x, min=0, max=15)
# Datenframe
df <- data.frame(x, y)

# plot()
plot(x,y, type="l", col="navyblue")

# ggplot()
ggplot(df, aes(x=x, y=y)) + 
  geom_line(col="navyblue")

b) Plotten Sie die Verteilungsfunktion der Wartezeit.
# x-Werte
x <- seq(-1, 16, by=0.1)
# Verteiluingsfunktion der Uniformverteilung für alle x
y <- punif(x, min=0, max=15)
# Datenframe
df <- data.frame(x, y)

# plot()
plot(x,y, type="l", col="aquamarine3")

# ggplot()
ggplot(df, aes(x=x, y=y)) + 
  geom_line(col="aquamarine3")

c) Berechnen Sie die Wahrscheinlichkeit, weniger als 5 Minuten auf den Bus zu warten.
punif(5, min = 0, max = 15, lower.tail=TRUE)
[1] 0.3333333
d) Berechnen Sie die Wahrscheinlichkeit, länger als 12 Minuten auf den Bus zu warten.
punif(12, min = 0, max = 15, lower.tail=FALSE)
[1] 0.2

Die Wahrscheinlichkeit beträgt 20%.

e) Berechnen Sie die Wahrscheinlichkeit, zwischen 5 und 10 Minuten auf den Bus zu warten.
punif(10, min = 0, max = 15) - punif(5, min = 0, max = 15) 
[1] 0.3333333

Die Wahrscheinlichkeit beträgt 33,33%.

f) Bei welcher Zeit zwischen 0 und 15 Minuten muss die Hälft der Personen kürzer auf den Bus warten als die angegebene Zeit?
qunif(0.5, min = 0, max = 15, lower.tail=TRUE)
[1] 7.5

50% der Personen muss weniger als 7,5 Minuten auf den Bus warten.

g) Bei welcher Zeit zwischen 0 und 15 Minuten müssen 10% der Personen länger auf den Bus warten als die angegebene Zeit?
qunif(0.1, min = 0, max = 15, lower.tail=FALSE)
[1] 13.5

10% der Personen müssen länger als 13,5 Minuten auf den Bus warten.

51.2 Lösung zur Aufgabe 44.7.2

a) Plotten Sie die Dichtefunktion von \(Z\).
x <- seq(-3, 3, 0.01)
y <- dnorm(x, mean = 0, sd = 1)

df = data.frame(x = x, y = y)

# plot()
plot(x,y, type="l", col="cornsilk4")

# ggplot()
ggplot(df, aes(x=x, y=y)) + 
  geom_line(col="cornsilk4")

b) Wie beeinflussen Mittelwert und Standardabweichung die Form der Gausschen Glockenkurve?
# erzeuge neue Werte von -3 bis 6
x <- seq(-3,6, by=0.005)

# Alles zusammen plotten
plot(x,dnorm(x,mean=2,s=0.5), col="blue", type="l", xlab="x", 
     ylab="f(x)",main="Normalverteilungen")
lines(x,dnorm(x,mean=0,s=1), col="black")
lines(x,dnorm(x,mean=2,s=2), col="darkorchid")
text(0,.45,"N(0;1)")
text(2.8, 0.6, "N(2;0.5)", col="blue")
text(5, 0.1, "N(2;2)", col="darkorchid")

Der MIttelwert verschiebt die Kurve, die Standardabweichung verformt sie. Je größer die Standardabweichung, desto flacher und breiter ist die Kurve.

c) Plotten Sie die Verteilungsfunktion von \(Z\).
# erzeuge neue Werte von -3 bis 3
x <- seq(-3, 3, 0.01)
y <- pnorm(x, mean=0, sd=1)
df = data.frame(x, y)

# plot()
plot(x,y, type="l", col="dodgerblue1")

# ggplot()
ggplot(df, aes(x=x, y=y)) + 
  geom_line(col="dodgerblue1")

d) Berechnen Sie die Wahrscheinlichkeit \(P(Z < -1)\).
pnorm(-1, mean=0, sd=1, lower.tail=TRUE)
[1] 0.1586553
e) Berechnen Sie die Wahrscheinlichkeit \(P(Z > 1)\).
pnorm(1, mean=0, sd=1, lower.tail=FALSE)
[1] 0.1586553
f) Berechnen Sie die Wahrscheinlichkeit, dass \(Z\) zwischen dem Mittelwert minus der Standardabweichung und dem Mittelwert plus der Standardabweichung liegt, d. h. \(P(-1 \leq Z \leq 1)\).
pnorm(1, mean=0, sd=1) - pnorm(-1, mean=0, sd=1)
[1] 0.6826895
g) Berechnen Sie die Wahrscheinlichkeit, dass \(Z\) zwischen dem Mittelwert minus zwei Standardabweichungen und dem Mittelwert plus zwei Standardabweichungen liegt, d. h. \(P(-2 \leq Z \leq 2)\).
pnorm(2, mean=0, sd=1) - pnorm(-2, mean=0, sd=1)
[1] 0.9544997
h) Berechnen Sie die Wahrscheinlichkeit, dass \(Z\) zwischen dem Mittelwert minus drei Standardabweichungen und dem Mittelwert plus drei Standardabweichungen liegt, d. h. \(P(-3 \leq Z \leq 3)\).
pnorm(3, mean=0, sd=1) - pnorm(-3, mean=0, sd=1)
[1] 0.9973002
i) Berechnen Sie die Quartile.
qnorm(c(0.25, 0.5, 0.75), mean=0, sd=1)
[1] -0.6744898  0.0000000  0.6744898
j) Bei welchem \(Z\)-Wert liegen 95% der Fläche unterhalb des Wertes?
qnorm(0.95, mean=0, sd=1, lower.tail=TRUE)
[1] 1.644854
k) Bei welchem \(Z\)-Wert liegen 2,5% der Fläche oberhalb des Wertes?
qnorm(0.025, mean=0, sd=1, lower.tail=FALSE)
[1] 1.959964

51.3 Lösung zur Aufgabe 44.7.3

a) Plotten Sie die Dichtefunktion dieser Verteilung.
x <- seq(0, 19.86, 0.01)
y <- dchisq(x, df=6)

df = data.frame(x = x, y = y)

# plot()
plot(x,y, type="l", col="forestgreen")

# ggplot()
ggplot(df, aes(x=x, y=y)) + 
  geom_line(col="forestgreen")

b) Wie groß ist die Wahrscheinlichkeit für \(P(X<6)\)?
pchisq(6, df=6, lower.tail=TRUE)
[1] 0.5768099
c) Berechnen Sie das fünfte Perzentil der Verteilung.
qchisq(0.05, df=6)
[1] 1.635383
d) Bei welchem Wert liegen 10% der Fläche oberhalb des Wertes?
qchisq(0.1, df=6, lower.tail=FALSE)
[1] 10.64464

51.4 Lösung zur Aufgabe 44.7.4

a) Plotten Sie die Dichtefunktion von \(X\) und vergleichen Sie diese mit der Dichtefunktion der Standardnormalverteilung.
x <- seq(-3.5, 3.5, 0.01)
y <- dt(x, df=8)
y2 <- dnorm(x)
df = data.frame(x=x, y=y, y2=y2)

# plot()
plot(x,y, type="l", col="firebrick4")
lines(x,y2, lty=3)

# ggplot()
ggplot(df, aes(x=x, y=y)) + 
  geom_line(col="firebrick4") +
  geom_line(aes(x=x, y=y2), lty=3)

b) Berechnen Sie das 8te Perzentil von \(X\).
qt(0.08, df=8)
[1] -1.548892
c) Bei welchem Wert von \(X\) liegen 5% aller Fälle oberhalb dieses Wertes?
qt(0.05, df=8, lower.tail = FALSE)
[1] 1.859548

51.5 Lösung zur Aufgabe 44.7.5

a) Plotten Sie die Dichtefunktion von \(X\).
x <- seq(0, 3.75, 0.01)
y <- df(x, df1 = 10, df2 = 20)

df = data.frame(x=x, y=y)

# plot()
plot(x,y, type="l", col="indianred2")

# ggplot()
ggplot(df, aes(x=x, y=y)) + 
  geom_line(col="indianred2")

b) Berechnen Sie Wahrscheinlichkeit \(P(X>1)\).
pf(1, df1=10, df2=20, lower.tail=FALSE)
[1] 0.4755005
c) Berechnen Sie den Interquartilsabstand.
qf(c(0.75), df1=10, df2=20)  - qf(0.25, df1=10, df2=20)
[1] 0.7430938

51.6 Lösung zur Aufgabe 44.7.6

a) Berechnen Sie die Wahrscheinlichkeit, dass ein zufällig ausgewählter Diabetiker einen Glukosespiegel von weniger als 120 mg/100 ml hat.
pnorm(120, mean=106, sd=8)
[1] 0.9599408
b) Wie viel Prozent der Personen haben einen Glukosespiegel zwischen 90 und 120 mg/100 ml?
pnorm(120, mean=106, sd=8) - pnorm(90, mean=106, sd=8)
[1] 0.9371907

Etwa 93.72% der Personen.

c) Berechnen und interpretieren Sie das erste Quartil des Glukosespiegels.
qnorm(0.25, mean=106, sd=8)
[1] 100.6041

51.7 Lösung zur Aufgabe 44.7.7

a) Wie viele von ihnen haben einen Cholesterinspiegel zwischen 210 und 240 mg/dl?
# Anteile berechnen
pnorm(240, mean=220, sd=30) - pnorm(210, mean=220, sd=30)
[1] 0.3780661

Etwa 37.81% der Personen.

b) Wenn ein Cholesterinspiegel von mehr als 250 mg/dl eine Thrombose auslösen kann, wie viele von ihnen sind thrombosegefährdet?
pnorm(250, mean=220, sd=30, lower.tail=FALSE)
[1] 0.1586553

Etwa 15.87% der Personen.

c) Welcher Cholesterinwert wird von mindestens 20% der Männer erreicht?
# Anteile berechnen
qnorm(0.2, mean=220, sd=30)
[1] 194.7514