13 Nemparaméteres próbák
Nemparaméteres próbákat a Statistics → Nonparametric tests menüben találunk (13.1. ábra).
13.1: ábra Nemparaméteres próbák: Statistics → Nonparametric tests
13.1 Két, független mintás Wilcoxon–Mann–Whitney próba
Példánkban azt vizsgáljuk egy kétmintás próbával (Statistics → Nonparametric tests → Two-samples Wilcoxon test…), hogy egy kísérletben, melyben enyhe vérszegénység vaskészítménnyel való kezelését tesztelték 10 kezelttel
és 10 placebo-kontrollal, a kísérleti egyedeket a két csoportba véletlenszerűen besorolva, hogy a kezelt csoport hemoglobinszintje (g/dl) magasabb lett-e. A
kontrollcsoportban az egyik mérés nem sikerült, ezért ott csak 9 érték van.? (13.2. ábra, hemoglobin.csv). Ehhez meg kell adnunk a következőket:
13.2: ábra Kétmintás Wilcoxon–Mann–Whitney próba: Statistics → Nonparametric tests → Two-samples Wilcoxon test…
- Groups (pick one) Csoportosító változó (2 szintű faktor lehet)
 - Response variable (pick one) A vizsgálandó változó
 
Az Options fülre kattintva megjelenő párbeszéd ablakban (13.3. ábra) pedig a következőket:
- Difference Eltolás
 - Alternative Hypothesis Az alternatív hipotézis típusa
- Two-sided \(H_1:\) eltolás\(\neq 0\)
 - Difference < 0 \(H_1:\) eltolás\(<0\)
 - Difference > 0 \(H_1:\) eltolás\(>0\)
 
 - Type of test A teszt típusa
- Default Alapbeállítás
 - Exact Egzakt módszer
 - Normal approximation Normális közelítés korrekció nélkül
 - Normal approximation with continuity correction Normális közelítés folytonossági korrekcióval
 
 
13.3: ábra Kétmintás Wilcoxon–Mann–Whitney próba: Statistics → Nonparametric tests → Two-samples Wilcoxon test… → Options
A teszt outputjában megkapjuk a minták mediánját, normális közelítést használva a \(W\) statisztika értékét és a \(p\)-értéket (p-value).
tapply(hemogl$hemogl, hemogl$csoport, median, na.rm=TRUE)
##   kezelt kontroll 
##    10.45     9.20
wilcox.test(hemogl ~ csoport, alternative='greater', exact=FALSE, correct=FALSE, data=hemogl)
## 
##  Wilcoxon rank sum test
## 
## data:  hemogl by csoport
## W = 76.5, p-value = 0.00499
## alternative hypothesis: true location shift is greater than 0
(TK. 7.6.2. fejezet, 7.18. példa)
13.2 Két, párosított mintás Wilcoxon–próba
Példánkban az vizsgáljuk egy páros próbával (Statistics → Nonparametric tests → Paired-samples Wilcoxon test…), hogy tíz kísérleti személynek ugyanazzal a módszerrel mérve a reakcióidejét csendes és zajos
környezetben, bizonyíthatóan nagyobb-e a reakcióidő zajos
környezetben? (13.4. ábra, reakcio_ido.csv). Ehhez meg kell adnunk a következőket:
13.4: ábra Páros Wilcoxon–próba: Statistics → Nonparametric tests → Paired-samples Wilcoxon test…
- First variable (pick one) Egyik adatsort tartalmazó változó
 - Second variable (pick one) Másik adatsort tartalmazó változó
 
Az Options fülre kattintva megjelenő párbeszéd ablakban (13.5. ábra) pedig a következőket:
- Alternative Hypothesis Az alternatív hipotézis típusa
- Two-sided \(H_1:\) a különbségek mediánja\(\neq 0\)
 - Difference < 0 \(H_1:\) a különbségek mediánja\(<0\)
 - Difference > 0 \(H_1:\) a különbségek mediánja\(>0\)
 
 - Type of test A teszt típusa
- Default Alapbeállítás
 - Exact Egzakt módszer
 - Normal approximation Normális közelítés korrekció nélkül
 - Normal approximation with continuity correction Normális közelítés folytonossági korrekcióval
 
 
13.5: ábra Páros Wilcoxon–próba beállításai: Statistics → Nonparametric tests → Paired-samples Wilcoxon test… → Options
A teszt outputjában (normális közelítést használva) a \(W\) statisztika értékét és a \(p\)-értéket (p-value) kapjuk meg.
wilcox.test(reakcio$zajos, reakcio$csendes, alternative='greater', correct=FALSE, exact=FALSE, paired=TRUE)
## 
##  Wilcoxon signed rank test
## 
## data:  reakcio$zajos and reakcio$csendes
## V = 38.5, p-value = 0.0289
## alternative hypothesis: true location shift is greater than 0
(TK. 7.6.1. fejezet, 7.17 példa)
13.3 Több, független mintás Kruskal–Wallis-féle H-próba
Példánkban azt vizsgáljuk (Statistics → Nonparametric tests → Kruskal-Wallis test…), hogy négy terület mindegyikén 5-5 véletlenszerűen kiválasztott azonos méretű kvadrátban megszámolt pipacsok alapján, van-e különbség a négy terület között a pipacsok gyakoriságát tekintve. (@ref(fig.KW). ábra, pipacs.csv). Ehhez meg kell adnunk a következőket (a területet faktorrá kell alakítani):
13.6: ábra Kruskal–Wallis-féle H-próba: Statistics → Nonparametric tests → Kruskal-Wallis test…
- Groups (pick one) Csoportosító változó (faktor!)
 - Response variable (pick one) A vizsgálandó változó
 
A teszt outputjában megkapjuk a minta mediánokat, a Khi-négyzet statisztika (chi-squared) értékét a hozzá tartozó szabadsági fokkal (df) és a \(p\)-értéket (p-value).
tapply(pipacs$megfigy, pipacs$terulet, median, na.rm=TRUE)
##  1  2  3  4 
## 14 28  8 48
kruskal.test(megfigy ~ terulet, data=pipacs)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  megfigy by terulet
## Kruskal-Wallis chi-squared = 11.483, df = 3, p-value = 0.009381
(TK. 7.6.3. fejezet, 7.19. példa)
Ha ugyanazt a területet vizsgálnánk 4 különböző alkalommal, akkor a megfigyeléseink nem lennének függetlenek. Ekkor a menüben következő Friedman rank-sum test használata lehet alkalmas.