56  Lösungen Chiquadratests für Anteilswerte

Hier finden Sie die Lösungen zu den Übungsaufgaben von Abschnitt 44.12.

Die hier vorgestellten Lösungen stellen immer nur eine mögliche Vorgehensweisen dar und sind sicherlich nicht der Weisheit letzter Schluss. In R führen viele Wege nach Rom, und wenn Sie mit anderem Code zu den richtigen Ergebnissen kommen, dann ist das völlig in Ordnung.

56.1 Lösung zur Aufgabe 44.12.1

a) Übertragen Sie die Daten in ein Datenframe mit den Variablen Geschwuer und Blutgruppe.
df <- data.frame(Geschwuer=c(rep("Geschwür", 1655),
                             rep("gesund", 10000)), 
                 Blutgruppe=c(rep("0", 911), rep("A", 579),
                              rep("B", 124), rep("AB", 41),
                              rep("0", 4578), rep("A", 4219),
                              rep("B", 890), rep("AB", 313))
)
b) Führen Sie einen Chiquadrattest auf die Hypothese durch, dass die Geschwüre von der Blutgruppe abhängig sind.
chisq.test(df$Geschwuer, df$Blutgruppe)   

    Pearson's Chi-squared test

data:  df$Geschwuer and df$Blutgruppe
X-squared = 49.016, df = 3, p-value = 1.295e-10

Es gibt unterschiede, p ist kleiner als 0,05.

c) Gibt es in Anbetracht der Ergebnisse des Vergleichs einen Zusammenhang zwischen dem Magengeschwür und der Blutgruppe? Können wir behaupten, dass der Anteil der Ulkuspatienten je nach Blutgruppe unterschiedlich ist?
reporttools::pairwise.fisher.test(df$Geschwuer, df$Blutgruppe, 
                                  p.adjust.method = "bonferroni")

    Pairwise comparisons using 

data:  df$Geschwuer and df$Blutgruppe 

   0       A      AB    
A  4.1e-10 -      -     
AB 0.0695  1.0000 -     
B  0.0023  1.0000 1.0000

P value adjustment method: bonferroni 

Blutgruppe 0 unterscheidet sich von allen anderen.

56.2 Lösung zur Aufgabe 44.12.2

a) Übertragen Sie die Daten in ein Datenframe mit den Variablen Region und Blutgruppe.
df <- data.frame(
          Blutgruppe=c(rep("A", 185), rep("B", 55),
                      rep("0", 223), rep("AB", 15)), 
          Region=c(rep("Eskdale", 33), rep("Annadale", 54), rep("Nithsdale", 98), 
                   rep("Eskdale", 6), rep("Annadale", 14), rep("Nithsdale", 35),
                   rep("Eskdale", 56), rep("Annadale", 52), rep("Nithsdale", 115),
                   rep("Eskdale", 5), rep("Annadale", 5), rep("Nithsdale", 5))
)
b) Führen Sie einen Chiquadrattest auf die Hypothese durch, dass die Blutgruppe von der Region abhängig sind.
chisq.test(df$Blutgruppe, df$Region)   
Warning in chisq.test(df$Blutgruppe, df$Region): Chi-Quadrat-Approximation kann
inkorrekt sein

    Pearson's Chi-squared test

data:  df$Blutgruppe and df$Region
X-squared = 10.454, df = 6, p-value = 0.1068

Der Test ist nicht signifikant.

c) Gibt es in Anbetracht der Ergebnisse einen Zusammenhang zwischen der Blutgruppe und der Region? Können wir behaupten, dass die Region keinen Einfluss auf die Blutgruppe hat?
reporttools::pairwise.fisher.test(df$Blutgruppe, df$Region, 
                                  p.adjust.method = "bonferroni")

    Pairwise comparisons using 

data:  df$Blutgruppe and df$Region 

          Annadale Eskdale
Eskdale   0.39     -      
Nithsdale 1.00     0.10   

P value adjustment method: bonferroni 

Es sind keine Unterschiede zu finden.

56.3 Lösung zur Aufgabe 44.12.3

a) Übertragen Sie die Daten in ein Datenframe mit den Variablen Rauchen und Geschlecht.
df <- data.frame(
          Geschlecht=c(rep("m", 9), rep("w", 17)), 
          Rauchen=c(rep("ja", 2), rep("nein", 7),
                    rep("ja", 6), rep("nein", 11))
)
b) Führen Sie einen Chi-Quadrat-Test durch, um festzustellen, ob das Rauchen mit dem Geschlecht zusammenhängt.
chisq.test(df$Rauchen, df$Geschlecht) 
Warning in chisq.test(df$Rauchen, df$Geschlecht): Chi-Quadrat-Approximation
kann inkorrekt sein

    Pearson's Chi-squared test with Yates' continuity correction

data:  df$Rauchen and df$Geschlecht
X-squared = 0.057825, df = 1, p-value = 0.81
# kleines sample, besser exakten Fisher Test
fisher.test(df$Rauchen, df$Geschlecht)

    Fisher's Exact Test for Count Data

data:  df$Rauchen and df$Geschlecht
p-value = 0.6673
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.04160546 4.26600654
sample estimates:
odds ratio 
  0.536523 
c) Ist die Verteilung der Raucher bei beiden Geschlechtern gleich?
# kleines sample, besser exakten Fisher Test
fisher.test(df$Rauchen, df$Geschlecht)

    Fisher's Exact Test for Count Data

data:  df$Rauchen and df$Geschlecht
p-value = 0.6673
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.04160546 4.26600654
sample estimates:
odds ratio 
  0.536523 

Beide Tests sind nicht signifikant, es besteht kein Unterschied in den Gruppen.

56.4 Lösung zur Aufgabe 44.12.4

a) Übertragen Sie die Daten in ein Datenframe mit den Variablen drug1 und drug2.
df <- data.frame(
      drug1 = c( "Ja", "Ja", "Ja", "Ja", "Ja", "Nein", "Ja", "Nein", 
                 "Ja", "Ja", "Ja", "Nein", "Ja", "Nein", "Ja", "Ja", 
                 "Ja", "Nein", "Ja", "Ja"),
      drug2 = c("Nein", "Nein", "Ja", "Nein", "Ja", "Ja", "Nein", "Nein", 
                "Nein", "Nein", "Ja", "Nein", "Ja", "Nein", "Nein", "Ja", 
                "Nein", "Ja", "Nein", "Nein")
)
b) Führen Sie einen McNemar-Test durch, um festzustellen, ob die Linderung mit dem Medikament zusammenhängt.
mcnemar.test(df$drug1, df$drug2)

    McNemar's Chi-squared test with continuity correction

data:  df$drug1 and df$drug2
McNemar's chi-squared = 4.0833, df = 1, p-value = 0.04331

Das Ergebnis ist signifikant. Es gibt einen Unterschied.

c) Können wir nach dem Ergebnis des Tests behaupten, dass die Linderung der Migräne vom Medikament abhängt? Wenn ja, welches Medikament bewirkt eine signifikant höhere Linderung?
prop.table(table(df$drug1))

  Ja Nein 
0.75 0.25 
prop.table(table(df$drug2))

  Ja Nein 
0.35 0.65 

Medikament drug1 wirkt besser.

56.5 Lösung zur Aufgabe 44.12.5

Ist ein komatöser Zustand bei der Ankunft im Krankenhaus ein Risikofaktor zu versterben?
df <- data.frame(
      Ergebnis = c(rep("überlebt", 521), rep("verstorben", 207)),
      Komatös = c(rep("nein", 484), rep("ja", 37),
                  rep("nein", 118), rep("ja", 89)
  )
)

chisq.test(df$Ergebnis, df$Komatös)  

    Pearson's Chi-squared test with Yates' continuity correction

data:  df$Ergebnis and df$Komatös
X-squared = 130.86, df = 1, p-value < 2.2e-16

Ja, es gibt einen Unterschied zwischen komatösen und nicht-komatösen Patienten.

56.6 Lösung zur Aufgabe 44.12.6

Ist die Wirksamkeit der beiden Behandlungen die gleiche?
df <- data.frame(
      Therapie = c(rep("A", 32), rep("B", 28)),
      Wirkung = c(rep("Sehr gut", 10), rep("gut", 14), rep("schlecht", 8),
                  rep("Sehr gut", 12), rep("gut", 10), rep("schlecht", 6)
  )
)

chisq.test(df$Wirkung, df$Therapie)

    Pearson's Chi-squared test

data:  df$Wirkung and df$Therapie
X-squared = 0.87141, df = 2, p-value = 0.6468

Es kann kein signifikanter Unterschied gezeigt werden.

56.7 Lösung zur Aufgabe 44.12.7

Können wir dann behaupten, dass Frauen in diesem Fach erfolgreicher sind als Männer?
df <- data.frame(
      Geschlecht = c(rep("m", 10), rep("w", 10)),
      bestanden = c(rep("ja", 2), rep("nein", 8),
                    rep("ja", 4), rep("nein", 6)
  )
)

table(df)
          bestanden
Geschlecht ja nein
         m  2    8
         w  4    6
chisq.test(df$bestanden, df$Geschlecht)
Warning in chisq.test(df$bestanden, df$Geschlecht): Chi-Quadrat-Approximation
kann inkorrekt sein

    Pearson's Chi-squared test with Yates' continuity correction

data:  df$bestanden and df$Geschlecht
X-squared = 0.2381, df = 1, p-value = 0.6256

Es kann kein signifikanter Unterschied gezeigt werden.

56.8 Lösung zur Aufgabe 44.12.8

Können wir bestätigen, dass es unterschiedliche Meinungen über Hans und Erna gibt?
df <- data.frame(
      Erna = c(rep("ja", 85), rep("nein", 65)),
      Hans = c(rep("ja", 37), rep("nein", 48),
               rep("ja", 44), rep("nein", 21)
  )
)

table(df)
      Hans
Erna   ja nein
  ja   37   48
  nein 44   21
chisq.test(df$Erna, df$Hans)

    Pearson's Chi-squared test with Yates' continuity correction

data:  df$Erna and df$Hans
X-squared = 7.712, df = 1, p-value = 0.005486

Es gibt einen Signifikanten Unterschied zwischen den Dozenten.

prop.table(table(df$Erna))

       ja      nein 
0.5666667 0.4333333 
prop.table(table(df$Hans))

  ja nein 
0.54 0.46 

Die Studierenden mögen Erna ein bisschen mehr als Hans.