13 Nemparaméteres próbák
Nemparaméteres próbákat a Statistics → Nonparametric tests menüben találunk (13.1. ábra).

13.1: ábra Nemparaméteres próbák: Statistics → Nonparametric tests
13.1 Két, független mintás Wilcoxon–Mann–Whitney próba
Példánkban azt vizsgáljuk egy kétmintás próbával (Statistics → Nonparametric tests → Two-samples Wilcoxon test…), hogy egy kísérletben, melyben enyhe vérszegénység vaskészítménnyel való kezelését tesztelték 10 kezelttel
és 10 placebo-kontrollal, a kísérleti egyedeket a két csoportba véletlenszerűen besorolva, hogy a kezelt csoport hemoglobinszintje (g/dl) magasabb lett-e. A
kontrollcsoportban az egyik mérés nem sikerült, ezért ott csak 9 érték van.? (13.2. ábra, hemoglobin.csv
). Ehhez meg kell adnunk a következőket:

13.2: ábra Kétmintás Wilcoxon–Mann–Whitney próba: Statistics → Nonparametric tests → Two-samples Wilcoxon test…
- Groups (pick one) Csoportosító változó (2 szintű faktor lehet)
- Response variable (pick one) A vizsgálandó változó
Az Options fülre kattintva megjelenő párbeszéd ablakban (13.3. ábra) pedig a következőket:
- Difference Eltolás
- Alternative Hypothesis Az alternatív hipotézis típusa
- Two-sided \(H_1:\) eltolás\(\neq 0\)
- Difference < 0 \(H_1:\) eltolás\(<0\)
- Difference > 0 \(H_1:\) eltolás\(>0\)
- Type of test A teszt típusa
- Default Alapbeállítás
- Exact Egzakt módszer
- Normal approximation Normális közelítés korrekció nélkül
- Normal approximation with continuity correction Normális közelítés folytonossági korrekcióval

13.3: ábra Kétmintás Wilcoxon–Mann–Whitney próba: Statistics → Nonparametric tests → Two-samples Wilcoxon test… → Options
A teszt outputjában megkapjuk a minták mediánját, normális közelítést használva a \(W\) statisztika értékét és a \(p\)-értéket (p-value
).
tapply(hemogl$hemogl, hemogl$csoport, median, na.rm=TRUE)
## kezelt kontroll
## 10.45 9.20
wilcox.test(hemogl ~ csoport, alternative='greater', exact=FALSE, correct=FALSE, data=hemogl)
##
## Wilcoxon rank sum test
##
## data: hemogl by csoport
## W = 76.5, p-value = 0.00499
## alternative hypothesis: true location shift is greater than 0
(TK. 7.6.2. fejezet, 7.18. példa)
13.2 Két, párosított mintás Wilcoxon–próba
Példánkban az vizsgáljuk egy páros próbával (Statistics → Nonparametric tests → Paired-samples Wilcoxon test…), hogy tíz kísérleti személynek ugyanazzal a módszerrel mérve a reakcióidejét csendes és zajos
környezetben, bizonyíthatóan nagyobb-e a reakcióidő zajos
környezetben? (13.4. ábra, reakcio_ido.csv
). Ehhez meg kell adnunk a következőket:

13.4: ábra Páros Wilcoxon–próba: Statistics → Nonparametric tests → Paired-samples Wilcoxon test…
- First variable (pick one) Egyik adatsort tartalmazó változó
- Second variable (pick one) Másik adatsort tartalmazó változó
Az Options fülre kattintva megjelenő párbeszéd ablakban (13.5. ábra) pedig a következőket:
- Alternative Hypothesis Az alternatív hipotézis típusa
- Two-sided \(H_1:\) a különbségek mediánja\(\neq 0\)
- Difference < 0 \(H_1:\) a különbségek mediánja\(<0\)
- Difference > 0 \(H_1:\) a különbségek mediánja\(>0\)
- Type of test A teszt típusa
- Default Alapbeállítás
- Exact Egzakt módszer
- Normal approximation Normális közelítés korrekció nélkül
- Normal approximation with continuity correction Normális közelítés folytonossági korrekcióval

13.5: ábra Páros Wilcoxon–próba beállításai: Statistics → Nonparametric tests → Paired-samples Wilcoxon test… → Options
A teszt outputjában (normális közelítést használva) a \(W\) statisztika értékét és a \(p\)-értéket (p-value
) kapjuk meg.
wilcox.test(reakcio$zajos, reakcio$csendes, alternative='greater', correct=FALSE, exact=FALSE, paired=TRUE)
##
## Wilcoxon signed rank test
##
## data: reakcio$zajos and reakcio$csendes
## V = 38.5, p-value = 0.0289
## alternative hypothesis: true location shift is greater than 0
(TK. 7.6.1. fejezet, 7.17 példa)
13.3 Több, független mintás Kruskal–Wallis-féle H-próba
Példánkban azt vizsgáljuk (Statistics → Nonparametric tests → Kruskal-Wallis test…), hogy négy terület mindegyikén 5-5 véletlenszerűen kiválasztott azonos méretű kvadrátban megszámolt pipacsok alapján, van-e különbség a négy terület között a pipacsok gyakoriságát tekintve. (@ref(fig.KW). ábra, pipacs.csv
). Ehhez meg kell adnunk a következőket (a területet
faktorrá kell alakítani):

13.6: ábra Kruskal–Wallis-féle H-próba: Statistics → Nonparametric tests → Kruskal-Wallis test…
- Groups (pick one) Csoportosító változó (faktor!)
- Response variable (pick one) A vizsgálandó változó
A teszt outputjában megkapjuk a minta mediánokat, a Khi-négyzet statisztika (chi-squared
) értékét a hozzá tartozó szabadsági fokkal (df
) és a \(p\)-értéket (p-value
).
tapply(pipacs$megfigy, pipacs$terulet, median, na.rm=TRUE)
## 1 2 3 4
## 14 28 8 48
kruskal.test(megfigy ~ terulet, data=pipacs)
##
## Kruskal-Wallis rank sum test
##
## data: megfigy by terulet
## Kruskal-Wallis chi-squared = 11.483, df = 3, p-value = 0.009381
(TK. 7.6.3. fejezet, 7.19. példa)
Ha ugyanazt a területet vizsgálnánk 4 különböző alkalommal, akkor a megfigyeléseink nem lennének függetlenek. Ekkor a menüben következő Friedman rank-sum test használata lehet alkalmas.