Definitie
Autocorrelatie betekent dat de residuen (in een tijdsreeks) van een eenheid met elkaar gecorreleerd zijn. Dit kan bijvoorbeeld voor de hand liggen tussen twee opeenvolgende periodes. Meet men bijvoorbeeld oogstvolumes per kwartaal, dan zal een lag van 4 kwartalen (seizoen op seizoen) een sterkere correlatie opleveren. Men spreekt ook van seriële correlatie.Autocorrelatie is een schending van de OLS assumpties ('spherical error variance'). De schatting van de coëfficiënten zelf is unbiased, maar de variantie van de schatter (standaardfout en dus significantie) zal worden onderschat.
Tests
De meest gebruikelijke test is de Durbin-Watson test. Dit is op te vragen bij een lineaire regressie. De waarde van D-W ligt steeds tussen 0 en 4, en idealiter op 2. Afwijkingen zijn een teken aan de wand dat er iets loos is. Op wikipedia vindt je een beschouwing van de kritische waarden voor d, waar de onder- en bovenlimieten iets anders geïnterpreteerd moeten worden dan bij een gewoon betrouwbaarheidsinterval.Voorwaarden voor het ontbreken van autocorrelatie:
d > bovenlimiet
4-d > onderlimiet
In SPSS
Voor zover ik weet moet men bij paneldata de test zelf maken, door voor elke eenheid een aparte analyse te maken en de residuen te bewaren. In dit geval is d niet gewoon het gemiddelde van de verschillende d's, maar de ratio van de som van de teller van alle d's en de som van de noemer van alle d's. Ik vind dat niet praktisch, maar soit. In onderstaand voorbeeld is PC_recon_select de ID-variabele, en RSZ_jaar de (enige) regressor.SORT CASES BY PC_recon_select. SPLIT FILE LAYERED BY PC_recon_select.
REGRESSION
/DESCRIPTIVES MEAN STDDEV CORR SIG N
/MISSING LISTWISE
/STATISTICS COEFF OUTS BCOV R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/DEPENDENT drift_yoy
/METHOD=ENTER RSZ_jaar
/RESIDUALS DURBIN HIST(ZRESID)
/SAVE RESID(Cres).
DO IF RSZ_jaar > 1997.
COMPUTE teller = (Cres - lag(Cres,1))**2.
COMPUTE noemer = Cres**2.
END IF.
EXECUTE.
USE ALL.
SPLIT FILE OFF.
DESCRIPTIVES VARIABLES=teller noemer
/STATISTICS=MEAN SUM STDDEV MIN MAX.
Voor sterkere correlatie (higher order: langere lags) en wanneer een van de onafhankelijke variabelen een lag van de afhankelijke is, gebruikt men de Breusch–Godfrey test.
[...]
This involves an auxiliary regression, wherein the residuals obtained from estimating the model of interest are regressed on (a) the original regressors and (b) k lags of the residuals, where k is the order of the test. The simplest version of the test statistic from this auxiliary regression is TR2, where T is the sample size and R2 is the coefficient of determination. Under the null hypothesis of no autocorrelation, this statistic is asymptotically distributed as ?2 with k degrees of freedom.
Oplossing
De assumptie van 'spherical error variance' is niet noodzakelijk bij minder restrictieve schattingen dan OLS. Ook kan de standaardfout gecorrigeerd worden.- Generalized least squares
- Newey–West standard errors
Context
Loonvorming...
Referenties
Wikipedia - AutocorrelationF. Hayashi (2000), Econometrics, §1.1 p. 11