7 Műveletek változókkal
A Data → Manage variables in active data set menü (7.1. ábra) segítségével készíthetünk származtatott változókat, átkódolhatjuk, törölhetjük stb. változóinkat.
- Recode variables… Változók átkódolása (7.1. fejezet)
- Compute new variable… Származtatott változók számítása (7.2. fejezet)
- Add observation numbers to data set Létrehoz egy sorszám változót az aktív adattáblázatban 1-től a sorok számáig számozva.
- Standardize variables… Változó standardizáltjának létrehozása (TK. 2.4.3. fejezet)
- Convert numeric variables to factors… Numerikus változók faktorrá alakítása (7.3. fejezet)
- Bin numeric variable… Faktor változót készít egy numerikus változó értéktartományának intervallumokra (bin) osztásával
- Reorder factor levels… Egy faktor szintjeinek átrendezése (R bevezető 0.6.4. fejezet)
- Drop unused factor levels… Nem használt faktor szintek eltávolítása (R bevezető 0.6.4. fejezet)
- Define contrast for a factor… Kontraszt megadása a kiválasztott faktorhoz
- Rename variables Változók átnevezése
- Delete variables from data set… Változók törlése az adattáblázatból
7.1 Változók átkódolása
Általában numerikus illetve faktor változók értékeinek kombinálásával új faktor vagy numerikus változó létrehozásához használható. Az alábbi példában az oz
táblázat TESTH
(testhossz) változójából hozunk létre egy olyan új változót, amely a 80 cm-nél rövidebbek esetén 'kicsi'
, a 81–110 cm-es tartományba esőknél 'kozepes'
, a 110 cm-nél hosszabbak esetén pedig 'nagy'
értéket vesz fel (7.2. ábra). Az átkódolt változó az adattáblázat utolsó oszlopban látható (7.3. ábra).
Az átkódolás párbeszédablak kitöltendő mezői:
- Variables to recode Az átkódolandó változó(k) kiválasztása
- New variable name or prefix for multiple recodes Az új, átkódolt változó neve, vagy egy előtag több változó egyszerre történő átkódolása esetén
- Make (each) new variable a factor Az új változók faktorrá alakítása
- Enter recode directives Átkódolási szabályok
- Az egyes szabályokat külön sorba kell írni, vagy pontosvesszővel elválasztani.
- Mindegyik
'input = output'
alakú (az aposztrófot nem kell beleírni!!). - Az
'NA'
megengedett érték. - A faktorszinteket idézőjelek közé kell tenni.
- Felsorolás esetén az értékeket vessző választja el:
'7,8,9,10 = "keves"'
- Tartományokat kettősponttal adunk meg:
'7:10 = "keves"'
. - Ha nem tudjuk az alsó, vagy felső határt, használhatjuk a
'lo'
illetve'hi'
-t helyettük:'lo:10 = "keves"
. - Az ‘else’ minden egyébre vonatkozik, amit addig nem adtunk meg:
'else = "sok"'
(TK. 11.6.1. fejezet 11.12. példa)
7.2 Származtatott változók számítása
A meglévő változókból készíthetünk új változókat (7.4. ábra). A párbeszédablak kitöltése:
- Current variables (double click to expression) A meglévő változók, kétszer rájuk kattintva átkerülnek az Expression to compute mezőbe
- New variable name Új változó neve
- Expression to compute A kiszámítandó kifejezés
A példában a BMI-t számítjuk ki (\(BMI= \frac{tomeg}{magas^2}\)) a testmagasság és tömeg változókból.
(TK. 2.4.3. fejezet, 2.3. példa )
Az Expression to compute mezőbe függvényeket is írhatunk.
Második példánkban egy numerikus változó értékeit rangokká transzformáljuk a rank()
függvény felhasználásával (7.5. ábra).
(TK. 2.4.3. fejezet)
7.3 Numerikus változók faktorrá alakítása
Sokszor előfordul, hogy kategóriás változókat numerikusan kódolnak. Ekkor, az elemzések korrekt elvégzése érdekében, faktorrá kell alakítanunk az adott változókat (7.6. ábra). A párbeszédablak kitöltése:
- Variables Faktorrá alakítandó változó(k) kiválasztása
- Factor levels Faktor szintek megadása - Supply level names Faktorszintek megnevezése - Use numbers Az eredeti számokat tartjuk meg faktorszintekként (szöveges típusú lesz)
- New variable name or prefix for multiple variables Új változó név, vagy előtag több változó esetén
(TK. 2.4.2. fejezet)