11 Arányokra vonatkozó próbák

Arányokra (valószínűségekre) vonatkozó próbákat a Statistics → Proportions menüben találunk (11.1. ábra).

11.1: ábra Arányokra vonatkozó próbák: Statistics → Proportions

A próbák használatát egy olyan táblázat adatain keresztül mutatjuk be, amelyben kutyák adatai (kutyak.csv) vannak egy bizonyos betegség tüneteinek meglétéről (tunet, 0: nincs, 1: van), illetve a kutyák ivaráról (ivar, 0: hím, 1: szuka). Mindkét változót faktorrá kell alakítani az elemzés előtt. Mindkét faktor két szintű kell, hogy legyen.

11.1 Egy arány (valószínűség) vizsgálata

Vizsgáljuk meg először azt, hogy az ivararány megfelel-e az 1:1-es aránynak? Egzakt binomiális próbával végezzük el az elemzést. Ehhez meg kell adni a következőket (11.2. ábra):

11.2: ábra Egy arány (valószínűség) vizsgálata: Statistics → Proportions → Single-sample proportion test…

Variable (pick one) A vizsgálandó változó

Az Options fülre kattintva a megjelenő párbeszéd ablakban (11.3. ábra) pedig a következőket:

Alternative Hypothesis Az alternatív hipotézis típusa
- Population proportion != p0 \(H_1: p \neq p_0\)
- Population proportion < p0 \(H_1: p < p_0\)
- Population proportion > p0 \(H_1: p > p_0\)
Type of test A teszt típusa
- Normal approximation Normális közelítés korrekció nélkül
- Normal approximation with continuity correction Normális közelítés folytonossági korrekcióval
- Exact binomial Egzakt binomiális próba
Null hypothesis: p = .5 A tesztelendő hipotetikus valószínűség (\(p_0\))
Confidence Level A mintából becsült populációs arányra vonatkozó konfidencia-intervallum megbízhatósági szintje

11.3: ábra Egy arány vizsgálatának beállításai: Statistics → Proportions → Single-sample proportion test… → Options

A teszt outputjában megkapjuk az ivarok gyakoriságait, a \(p\)-értéket (p-value). Ezenkívül kapunk egy – az alternatív hipotézis típusának megfelelő – konfidencia-intervallumot a populációs arányra, valamint az arány becslését.

.Table <- xtabs(~ ivar , data= kutyak )
.Table

## ivar
##  0  1 
## 22 25

binom.test(rbind(.Table), alternative='two.sided', p=.5, conf.level=.95)

## 
##  Exact binomial test
## 
## data:  rbind(.Table)
## number of successes = 22, number of trials = 47, p-value = 0.7709
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
##  0.3211153 0.6192221
## sample estimates:
## probability of success 
##              0.4680851

(TK. 7.4.1. fejezet)

11.2 Két arány hasonlítása független minták esetén

Példánkban azt vizsgáljuk, hogy a tünet előfordulási arány azonosnak tekinthető-e a hímek és szukák esetén. Korrekció nélküli normális közelítéssel végezzük el az elemzést. Ehhez meg kell adni a következőket (11.4. ábra):

11.4: ábra Két arány vizsgálata: Statistics → Proportions → Two-sample proportion test…

Groups (pick one) Csoportosító változó
Response variable (pick one) A vizsgálandó változó

11.5: ábra Két arány összehasonlítása: Statistics → Proportions → Two-sample proportion test… → Options

Az Options fülre kattintva a megjelenő párbeszéd ablakban (@ref(fig.ketprop). ábra) pedig a következőket:

Difference Különbség
Alternative Hypothesis Az alternatív hipotézis típusa
- Two-sided \(H_1: p_1 \neq p_2\)
- Difference < 0 \(H_1: p_1 < p_2\)
- Difference > 0 \(H_1: p_1 > p_2\)
Type of test A teszt típusa
- Normal approximation Normális közelítés korrekció nélkül
- Normal approximation with continuity correction Normális közelítés folytonossági korrekcióval
Confidence Level A mintából becsült populációs arányok különbségére vonatkozó konfidencia-intervallum megbízhatósági szintje

A teszt outputjában megkapjuk a tünet százalékos előfordulási arányát a két ivar esetén, valamint az ivarok gyakoriságait. A teszt outputjában megkapjuk a Khi-négyzet statisztika (X-squared) értékét, a szabadsági fokot (df), valamint a \(p\)-értéket (p-value). Ezenkívül kapunk egy – az alternatív hipotézis típusának megfelelő – konfidencia-intervallumot a populációs arányok különbségére, valamint az arányok becslését.

.Table <- xtabs(~ivar+tunet, data=kutyak)
rowPercents(.Table)

##     tunet
## ivar    0    1 Total Count
##    0 22.7 77.3   100    22
##    1 80.0 20.0   100    25

prop.test(.Table, alternative='two.sided', conf.level=.95, correct=FALSE)

## 
##  2-sample test for equality of proportions without continuity
##  correction
## 
## data:  .Table
## X-squared = 15.417, df = 1, p-value = 8.622e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  -0.8077818 -0.3376728
## sample estimates:
##    prop 1    prop 2 
## 0.2272727 0.8000000

(TK. 7.4.2. fejezet)