42  Übungsaufgaben

In diesem Kapitel werden Übungsaufgaben zu verschiedenen Teilen der Statistik vorgestellt und gelöst.

Die Aufgaben stammen von Gimeno et al. (2022)1. Dort werden die Lösungswege nur teilweise und nur unter Verwendung der Software RKWard2, aber ohne konkreten R-Code besprochen.

Auf den Seiten ab Kapitel 43 werden die Lösungen “zu Fuß” erarbeitet. Versuchen Sie möglichst, zunächst selbst eine Lösung zu finden, bevor Sie sich die Auflösungen anschauen.

Die Aufgaben sind nach unterschiedlichen Bereichen der Statistik gegliedert.

42.1 Häufigkeitsverteilungen

42.1.1 Aufgabe 42.1.1 Kinder in Familien

Für 25 Familien liegt die Anzahl an Kindern vor:

1, 2, 4, 2, 2, 2, 3, 2, 1, 1, 0, 2, 2, 0, 2, 2, 1, 2, 2, 3, 1, 2, 2, 1, 2

  1. Erstellen Sie ein Datenframe mit der Variable Kinder und übertragen Sie die Daten.
  2. Erzeugen Sie eine einfache Häufigkeitstabelle
  3. Erzeugen Sie ein Balkendiagramm der Häufigkeiten
  4. Erzeugen Sie eine vollständige Häufigkeitstabelle, inklusive absoluter, relativer und jeweils kumulativer Häufigkeiten

Für die Lösung siehe Abschnitt 43.1

42.1.2 Aufgabe 42.1.2 Patienten in der Notaufnahme

Den gesamten November über wurde die Anzahl an Patienten in der Notaufnahme erhoben

15 23 12 10 28 50 12 17 20 21 18 13 11 12 26 0 6 16 19 22 14 17 21 28 9 16 13 11 16 20

  1. Erstellen Sie ein Datenframe mit der Variable Patienten und übertragen Sie die Daten.
  2. Erzeugen Sie ein Boxplot. Gibt es Ausreißer? Wenn ja, entfernen Sie diese, bevor Sie weitermachen.
  3. Erzeugen Sie eine Häufigkeitstabelle, welche die Daten in 5 Klassen gruppiert.
  4. Erzeugen Sie ein Histogram der klassierten absoluten Häufigkeiten.
  5. Erzeugen Sie ebenso Histogramme der relativen und jeweils kumulativen Häufigkeiten, inklusive Polygonzügen.

Für die Lösung siehe Abschnitt 43.2

42.1.3 Aufgabe 42.1.3 Blutgruppen

Von 30 Personen wurden die Blutgruppen wie folgt bestimmt:

A, B, B, A, AB, 0, 0, A, B, B, A, A, A, A, AB, A, A, A, B, 0, B, B, B, A, A, A, 0, A, AB, 0

  1. Erstellen Sie ein Datenframe mit der Variable Blutgruppe und übertragen Sie die Daten.
  2. Erzeugen Sie eine Häufigkeitstabelle
  3. Erzeugen Sie ein Kreisdiagramm

Für die Lösung siehe Abschnitt 43.3

42.1.4 Aufgabe 42.1.4 Familienstand

Das Alter und der Familienstand von 28 Personen wurden wie folgt erhoben:

Familienstand Alter
Single 31 45 35 65 21 38 62 22 31
Verheiratet 72 39 62 59 25 44 54
Verwitwet 80 68 65 40 78 69 75
Geschieden 31 65 59 58 50
  1. Erstellen Sie ein Datenframe mit den Variablen Alter und Familienstand und übertragen Sie die Daten.
  2. Erzeugen Sie für jeden Familienstand eine Häufigkeitstabelle des Alters.
  3. Erzeugen Sie für jeden Familienstand eine Boxplot des Alters. Gibt es Ausreißer? In welcher Gruppe streut das Alter am meisten?
  4. Erzeugen Sie für jeden Familienstand eine Histogram des Alters. Wie unterscheiden sich die Histogramme?

Für die Lösung siehe Abschnitt 43.4

42.1.5 Aufgabe 42.1.5 Handballverletzungen

Die Anzahl der Verletzungen von Handballspielern eines Teams wurden wie folgt erhoben:

0, 1, 2, 1, 3, 0, 1, 0, 1, 2, 0, 1, 1, 1, 2, 0, 1, 3, 2, 1, 2, 1, 0, 1

  1. Erstellen Sie eine Häufigkeitstabelle
  2. Erzeugen Sie ein Säulendiagramm der relativen und kumulativen relativen Häufigkeiten.
  3. Erzeugen Sie ein Boxplot

Für die Lösung siehe Abschnitt 43.5

42.1.6 Aufgabe 42.1.6 Körpergröße

Von 30 Studierenden wurde die Körpergröße gemessen

179, 173, 181, 170, 158, 174, 172, 166, 194, 185,
162, 187, 198, 177, 178, 165, 154, 188, 166, 171,
175, 182, 167, 169, 172, 186, 172, 176, 168, 187

  1. Erstellen Sie ein Histogram der Körpergröße mit Klassen von 150cm bis 200cm, die jeweils 10cm breit sind.
  2. Gibt es Ausreißer?

Für die Lösung siehe Abschnitt 43.6

42.1.7 Aufgabe 42.1.7 Neugeborene

Der Datensatz neonates von rk.Teaching3 enthält Informationen über eine Stichprobe von 320 Neugeborenen, die im Laufe eines Jahres die normale Schwangerschaftsdauer in einem Krankenhaus erreicht haben.

  1. Erstellen Sie die Häufigkeitstabelle des APGAR-Scores nach 1 Minute. Wenn ein Score von 3 oder weniger anzeigt, dass das Neugeborene in einem kritischen Zusatand ist, wie viel Prozent der Neugeborenen in der Stichprobe sind dann in einem kritischen Zustand?

  2. Erstellen Sie die Häufigkeitstabelle des Geburtsgewichts der Neugeborenen, indem Sie die Daten in Klassen mit einer Breite von 0,5 kg von 2 bis 4,5 kg einteilen. Welches Intervall enthält die meisten Neugeborenen?

  3. Vergleichen Sie die Häufigkeitsverteilung des APGAR-Scores nach 1 Minute für Mütter unter 20 Jahren und für Mütter über 20 Jahren. Welche Gruppe hat mehr deprimierte Neugeborene?

  4. Vergleichen Sie die relative Häufigkeitsverteilung des Geburtsgewichts der Neugeborenen, je nachdem, ob die Mutter während der Schwangerschaft geraucht hat oder nicht. Wenn ein Gewicht unter 2,5 kg als niedriges Gewicht gilt, welche Gruppe hat einen höheren Prozentsatz an Neugeborenen mit niedrigem Gewicht?

  5. Berechnen Sie die Prävalenz von Neugeborenen mit niedrigem Gewicht für Mütter, die vor der Schwangerschaft geraucht haben, und den Nichtraucherinnen.

  6. Berechnen Sie das relative Risiko eines niedrigen Geburtsgewichts des Neugeborenen, wenn die Mutter während der Schwangerschaft raucht, im Vergleich dazu, wenn die Mutter nicht raucht.

  7. Erstellen Sie ein Balkendiagramm des APGAR-Scores nach 1 Minute. Welcher Score ist am häufigsten?

  8. Erstellen Sie das Balkendiagramm der kumulierten relativen Häufigkeit des APGAR-Scores nach 1 Minute. Unter welchem Wert liegen die Hälfte der Neugeborenen?

  9. Vergleichen Sie die Balkendiagramme der relativen Häufigkeitsverteilungen des APGAR-Scores nach 1 Minute, je nachdem, ob die Mutter während der Schwangerschaft geraucht hat oder nicht. Welche Schlussfolgerungen können gezogen werden?

  10. Erstellen Sie ein Histogramm der Geburtsgewichte der Neugeborenen mit Klassenbreiten von 0,5 kg von 2 bis 4,5 kg. Welche Klasse enthält die meisten Neugeborenen?

  11. Vergleichen Sie die relativen Häufigkeitshistogramme der Geburtsgewichte der Neugeborenen, mit Klassenbreiten von 0,5 kg von 2 bis 4,5 kg, je nachdem, ob die Mutter während der Schwangerschaft geraucht hat oder nicht. Welche Gruppe hat Neugeborene mit geringeren Gewichten?

  12. Vergleichen Sie die relativen Häufigkeitshistogramme der Geburtsgewichte der Neugeborenen, mit Klassenbreiten von 0,5 kg von 2 bis 4,5 kg, je nachdem, ob die Mutter vor der Schwangerschaft geraucht hat oder nicht. Welche Schlussfolgerungen können gezogen werden?

  13. Erstellen Sie ein Boxplot der Geburtsgewichte der Neugeborenen. Welcher Gewichtsbereich kann in der Stichprobe als normal angesehen werden? Gibt es Ausreißer in der Stichprobe?

  14. Vergleichen Sie die Boxplots der Geburtsgewichte der Neugeborenen je nachdem, ob die Mutter während der Schwangerschaft geraucht hat oder nicht und ob die Mutter unter 20 oder über 20 Jahre alt war. Welche Gruppe hat eine größere zentrale Streuung? Welche Gruppe hat Neugeborene mit geringerem Gewicht?

  15. Vergleichen Sie die Boxplots der APGAR-Scores nach 1 Minute und nach 5 Minuten. Welche Variable hat eine größere zentrale Streuung?

Für die Lösung siehe Abschnitt 43.7

42.2 Stichprobenstatistik

Bei diesen Aufgaben geht es vor allem um Lage- und Streuungskenngrößen.

42.2.1 Aufgabe 42.2.1 Kinder in Familien

Die Anzahl an Kindern in einer Stichprobe aus 25 Familien sind:

1, 2, 4, 2, 2, 2, 3, 2, 1, 1, 0, 2, 2, 0, 2, 2, 1, 2, 2, 3, 1, 2, 2, 1, 2

  1. Erstellen Sie ein Datenframe mit der Variable Kinder und übertragen Sie die Daten.
  2. Berechnen Sie das arithmetische Mittel, die Varianz sowie die Standardabweichung für die Anzahl an Kindern.
  3. Berechnen Sie die Quartile, die Spannweite, den Interquartilsabstand, das dritte Dezil sowie das 68te Perzentil.

Für die Lösung siehe Abschnitt 44.1

42.2.2 Aufgabe 42.2.2 Patienten in Notaufnahme

Den gesamten November über wurde die Anzahl an Patienten in der Notaufnahme erhoben

15 23 12 10 28 50 12 17 20 21 18 13 11 12 26 6 16 19 22 14 17 21 28 9 16 13 11 16 20

  1. Erstellen Sie ein Datenframe mit der Variable Patienten und übertragen Sie die Daten.
  2. Berechnen Sie das arithmetische Mittel, die Varianz, die Standardabweichung und den Variationskoeffizienten.
  3. Berechnen Sie die Skewness (Schiefe) und Kurtosis (“Spitzigkeit”) und interpretieren Sie die Werte.

Für die Lösung siehe Abschnitt 44.2


  1. siehe https://github.com/asalber/statistics_practice_rkteaching↩︎

  2. siehe https://rkward.kde.org/↩︎

  3. https://github.com/rkward-community/rk.Teaching, auch verfügbar unter https://www.produnis.de/R/data/neonates.RData↩︎