16 Modellekkel kapcsolatos műveletek

ábra Models menü: *Models*

16.1: ábra Models menü: Models

Az éppen aktív modellel kapcsolatos műveleteket a Models menüben találunk (16.1. ábra). Mindig csak az aktuális modell típusnak megfelelő menüpontok elérhetők. Ebben a fejezetben a lineáris modellekhez kapcsolódó fontosabb lehetőségeket részletesen bemutatjuk, a többit csak felsorolásszerűen.

16.1 Az aktív modell kiválasztása

  • Select active model… Az aktív modell általában az utoljára készített modell, de átállíthatjuk ezzel lehetőséggel, vagy az eszköztár jobb szélső – az éppen aktív modell nevét mutató – gombjának megnyomásával.

16.2 A modell összegzése

  • Summarize model Az aktív modell összegzése: summary() (ld. 14. fejezet output része). Lehetőség van különböző, ún. Sandwich estimator-ok választására a standard hiba becsléshez, amik jobb becslést adnak heteroscedasticitás illetve autokorreláció esetén.

(TK. 9.4.2. fejezet 9.3. példa)

16.3 Modellek együtthatóinak összehasonlítása

  • Compare modell coefficients Két vagy több modell által becsült együtthatók és standard hibáinak kilistázása könnyebben összehasonlítható formában.

16.4 Modellből számított értékek

  • Add observation statistics to data… Az adattáblához, új változókként hozzáfűzhetjük a következő, az aktív modellel számított értékeket (16.2. ábra):
ábra Modellből számított értékek hozzáfűzése az adattáblázathoz: *Models → Add observation statistics to data...*

16.2: ábra Modellből számított értékek hozzáfűzése az adattáblázathoz: Models → Add observation statistics to data…

  • Fitted values Becsült értékek
  • Residuals Reziduumok
  • Studentized residuals Studentizált (jacknife) reziduumok
  • Hat-values Hatóerő értékek
  • Cook’s distances Cook-féle távolságok
  • Observation indices A megfigyelés sorszáma

(TK. 9.10.3. fejezet)

16.5 Infromációs kritériumok

  • Akaike Information Criterion (AIC) A modell AIC értéke
  • Bayesian Information Criterion (AIC) A modell BIC értéke

(TK. 11.7.3. fejezet 11.13. példa)

16.6 Lépésenkénti modellszelkeció

Lépésenkénti modellszelekció (Stepwise model selection). Megadandó a szelekció iránya (Direction) és az információs kritérium, ami alapján történik a szelekció (Criterion) (16.3. ábra). Példánkban először létrehozzuk a következő modellt: BABTOMEG ~ TAP * HOM * TOMEG0. Majd elvégezzük a modellszelekciót.

ábra Lépésenkénti modell szelekció: *Models → Stepwise model selection... *

16.3: ábra Lépésenkénti modell szelekció: Models → Stepwise model selection…

Célszerű a futtatás után a szkript ablakban egy új modellt létrehozni (redmod) szelekció eredményeként, amellyel a továbbiakban dolgozhatunk:

LinearModel.2 <- lm(BABTOMEG ~ TAP*HOM*TOMEG0, data=lepke)
stepwise(LinearModel.2, direction='backward/forward', criterion='AIC')
## 
## Direction:  backward/forward
## Criterion:  AIC 
## 
## Start:  AIC=-392.66
## BABTOMEG ~ TAP * HOM * TOMEG0
## 
##                  Df Sum of Sq      RSS     AIC
## - TAP:HOM:TOMEG0  2 0.0020672 0.034941 -393.25
## <none>                        0.032874 -392.66
## 
## Step:  AIC=-393.25
## BABTOMEG ~ TAP + HOM + TOMEG0 + TAP:HOM + TAP:TOMEG0 + HOM:TOMEG0
## 
##                  Df Sum of Sq      RSS     AIC
## - HOM:TOMEG0      2 0.0017574 0.036698 -394.50
## - TAP:HOM         2 0.0024081 0.037349 -393.52
## <none>                        0.034941 -393.25
## + TAP:HOM:TOMEG0  2 0.0020672 0.032874 -392.66
## - TAP:TOMEG0      1 0.0047721 0.039713 -388.08
## 
## Step:  AIC=-394.5
## BABTOMEG ~ TAP + HOM + TOMEG0 + TAP:HOM + TAP:TOMEG0
## 
##              Df Sum of Sq      RSS     AIC
## - TAP:HOM     2 0.0015089 0.038207 -396.24
## <none>                    0.036698 -394.50
## + HOM:TOMEG0  2 0.0017574 0.034941 -393.25
## - TAP:TOMEG0  1 0.0044463 0.041145 -390.10
## 
## Step:  AIC=-396.24
## BABTOMEG ~ TAP + HOM + TOMEG0 + TAP:TOMEG0
## 
##              Df Sum of Sq      RSS     AIC
## - HOM         2 0.0003650 0.038572 -399.71
## <none>                    0.038207 -396.24
## + TAP:HOM     2 0.0015089 0.036698 -394.50
## + HOM:TOMEG0  2 0.0008582 0.037349 -393.52
## - TAP:TOMEG0  1 0.0043408 0.042548 -392.22
## 
## Step:  AIC=-399.71
## BABTOMEG ~ TAP + TOMEG0 + TAP:TOMEG0
## 
##              Df Sum of Sq      RSS     AIC
## <none>                    0.038572 -399.71
## + HOM         2 0.0003650 0.038207 -396.24
## - TAP:TOMEG0  1 0.0040274 0.042600 -396.15
## 
## Call:
## lm(formula = BABTOMEG ~ TAP + TOMEG0 + TAP:TOMEG0, data = lepke)
## 
## Coefficients:
##        (Intercept)         TAPlimitalt              TOMEG0  
##            0.29166            -0.08775             1.21381  
## TAPlimitalt:TOMEG0  
##           -1.43854
redmod = stepwise(LinearModel.2, direction='backward/forward', criterion='AIC')
## 
## Direction:  backward/forward
## Criterion:  AIC 
## 
## Start:  AIC=-392.66
## BABTOMEG ~ TAP * HOM * TOMEG0
## 
##                  Df Sum of Sq      RSS     AIC
## - TAP:HOM:TOMEG0  2 0.0020672 0.034941 -393.25
## <none>                        0.032874 -392.66
## 
## Step:  AIC=-393.25
## BABTOMEG ~ TAP + HOM + TOMEG0 + TAP:HOM + TAP:TOMEG0 + HOM:TOMEG0
## 
##                  Df Sum of Sq      RSS     AIC
## - HOM:TOMEG0      2 0.0017574 0.036698 -394.50
## - TAP:HOM         2 0.0024081 0.037349 -393.52
## <none>                        0.034941 -393.25
## + TAP:HOM:TOMEG0  2 0.0020672 0.032874 -392.66
## - TAP:TOMEG0      1 0.0047721 0.039713 -388.08
## 
## Step:  AIC=-394.5
## BABTOMEG ~ TAP + HOM + TOMEG0 + TAP:HOM + TAP:TOMEG0
## 
##              Df Sum of Sq      RSS     AIC
## - TAP:HOM     2 0.0015089 0.038207 -396.24
## <none>                    0.036698 -394.50
## + HOM:TOMEG0  2 0.0017574 0.034941 -393.25
## - TAP:TOMEG0  1 0.0044463 0.041145 -390.10
## 
## Step:  AIC=-396.24
## BABTOMEG ~ TAP + HOM + TOMEG0 + TAP:TOMEG0
## 
##              Df Sum of Sq      RSS     AIC
## - HOM         2 0.0003650 0.038572 -399.71
## <none>                    0.038207 -396.24
## + TAP:HOM     2 0.0015089 0.036698 -394.50
## + HOM:TOMEG0  2 0.0008582 0.037349 -393.52
## - TAP:TOMEG0  1 0.0043408 0.042548 -392.22
## 
## Step:  AIC=-399.71
## BABTOMEG ~ TAP + TOMEG0 + TAP:TOMEG0
## 
##              Df Sum of Sq      RSS     AIC
## <none>                    0.038572 -399.71
## + HOM         2 0.0003650 0.038207 -396.24
## - TAP:TOMEG0  1 0.0040274 0.042600 -396.15

A redukált modell összegzése (Summarize model):

summary(redmod, cor=FALSE)
## 
## Call:
## lm(formula = BABTOMEG ~ TAP + TOMEG0 + TAP:TOMEG0, data = lepke)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.084718 -0.016629 -0.001001  0.017550  0.055207 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         0.291655   0.007637  38.190  < 2e-16 ***
## TAPlimitalt        -0.087752   0.012789  -6.862 8.23e-09 ***
## TOMEG0              1.213812   0.502142   2.417   0.0192 *  
## TAPlimitalt:TOMEG0 -1.438542   0.617372  -2.330   0.0237 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.02724 on 52 degrees of freedom
## Multiple R-squared:  0.8104, Adjusted R-squared:  0.7994 
## F-statistic: 74.07 on 3 and 52 DF,  p-value: < 2.2e-16

(TK. 11.8. fejezet 11.14. példa)

16.7 Részmodell kiválasztása

A Subset model selection Egy olyan ábrát produkál, amelyen különböző paraméterszámú részmodelleket lehet összehasonlítani különböző, a modell “jóságát” mérő értékek alapján.

16.8 Konfidencia-intervallumok

Az adott modell együtthatóira számoltathatunk különböző konfidencia-intervallumokat, a szokásos standard hibán és t-eloszláson alapulót (Models → Confidence intervals…), bootstrap konfidencia-intervallumot, illetve a delta módszeren alapulót is. A konfidencia szint állítható (Confidence level).

(TK. 9.4.3. fejezet, 11.5.5. fejezet 11.10. példa)

16.9 Hipotézis vizsgálatok

A modellel kapcsolatos hipotézisvizsgálatok (16.4. ábra).

ábra Hipotézisvizsgálatok: *Models &rarr; Hypothesis tests*

16.4: ábra Hipotézisvizsgálatok: Models → Hypothesis tests

16.9.1 ANOVA-tábla

A modell ANOVA-táblázatát írja ki. Meg lehet adni, hogy melyik négyzetösszeggel, illetve “Sandwich estimator”-ral számoljon (16.5. ábra). (Megjegyzés: Nem az R anova() függvényét hívja meg, hanem a car csomag Anova() függvényét!).

ábra Négyzetösszeg típusának kiválasztása: *Models &rarr; Hypothesis tests &rarr; ANOVA table*

16.5: ábra Négyzetösszeg típusának kiválasztása: Models → Hypothesis tests → ANOVA table

A modellszelekcióval redukált modell ANOVA-táblája II-es típusú négyzetösszeggel számolva:

Anova(redmod, type="II")
## Anova Table (Type II tests)
## 
## Response: BABTOMEG
##              Sum Sq Df  F value  Pr(>F)    
## TAP        0.134792  1 181.7155 < 2e-16 ***
## TOMEG0     0.000597  1   0.8053 0.37366    
## TAP:TOMEG0 0.004027  1   5.4294 0.02372 *  
## Residuals  0.038572 52                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(TK. 11.5.3. fejezet 11.8. példa)

16.9.2 Modellek összehasonlítása

Két beágyazott modell összehasonlítása F-teszttel. Ki kell választani a megjelenő párbeszédablakban az összehasonlítandó modelleket ((fig:modoh). ábra).

ábra Modellek összehasonlítása: *Models &rarr; Hypothesis tests &rarr; Compare two  models...*

16.6: ábra Modellek összehasonlítása: Models → Hypothesis tests → Compare two models…

anova(LinearModel.2, redmod)
## Analysis of Variance Table
## 
## Model 1: BABTOMEG ~ TAP * HOM * TOMEG0
## Model 2: BABTOMEG ~ TAP + TOMEG0 + TAP:TOMEG0
##   Res.Df      RSS Df  Sum of Sq      F Pr(>F)
## 1     44 0.032874                            
## 2     52 0.038572 -8 -0.0056984 0.9534 0.4839

(TK. 11.5.3. fejezet 11.7. példa, 11.14. példa)

16.9.3 Lineáris hipotézisek tesztelése

Ebben a pontban van lehetőség arra, hogy a modellben kontrasztokat (a modellparaméterekből képzett lineáris kombináció) teszteljünk.

(TK. 11.11. fejezet)

16.10 Diagnosztikai eszközök

Lehetőség van numerikus és grafikus modelldiagnosztikák készítésére. Ezek közül csak a legáltalánosabban használtakat részletezzük.

16.10.1 Numerikus diagnosztikák

A modell változóinak általánosított variancia infláció faktorát a Models → Numerical diagnostics → Variance-inflation factors választásával számíttathatjuk ki. A többi lehetőséggel tesztelhetjük a hibatag szórásának állandóságát, az autókorreláltságot, nemlinearitást, kiugró értékeket, illetve transzformálhatjuk a célváltozót.

(TK. 278. o. 9.9. fejezet 9.11. példa)

16.10.2 Grafikus diagnosztikák

A szokásos diagnosztikus ábrákat a Models → Graphs → Basic diagnostic plots pontban találjuk (16.7. ábra).

ábra Diagnosztikus ábrák: *Models &rarr; Graphs &rarr; Basic diagnostic plots*

16.7: ábra Diagnosztikus ábrák: Models → Graphs → Basic diagnostic plots

(TK. 9.10.4. fejezet 9.20. ábra, 11.6. fejezet 11.11. példa)