Video: How autocorrelation works 2024
Een autocorrelatie plot toont de eigenschappen van een type gegevens dat bekend staat als een tijdreeks. Een tijdreeks verwijst naar observaties van een enkele variabele over een bepaalde tijdshorizon. De dagelijkse prijs van Microsoft-aandelen gedurende het jaar 2013 is bijvoorbeeld een tijdreeks.
Transversale gegevens verwijst naar observaties van veel variabelen op een enkel moment. De slotkoersen van de 30 aandelen in de Dow Jones Industrial Average op 31 januari 2014 zouden bijvoorbeeld als transversale gegevens worden beschouwd.
Een autocorrelatieplot is ontworpen om aan te geven of de elementen van een tijdreeks positief gecorreleerd, negatief gecorreleerd of onafhankelijk van elkaar zijn. (Het voorvoegsel auto betekent "zelf" - autocorrelatie verwijst specifiek naar de correlatie tussen de elementen van een tijdreeks.)
Een autocorrelatieplot geeft de waarde van de autocorrelatiefunctie (acf) op de verticale as weer. Het kan variëren van -1 tot 1.
De horizontale as van een autocorrelatiegrafiek toont de grootte van de lag tussen de elementen van de tijdreeks. De autocorrelatie met lag 2 is bijvoorbeeld de correlatie tussen de tijdreekselementen en de overeenkomstige elementen die twee eerdere perioden zijn waargenomen.
Deze afbeelding toont een autocorrelatieplot voor de dagelijkse prijzen van Apple-aandelen van 1 januari 2013 tot 31 december 2013.
In de grafiek is er een verticale lijn (een "piek") die overeenkomt met elke vertraging. De hoogte van elke spike toont de waarde van de autocorrelatiefunctie voor de lag.
De autocorrelatie met lag nul is altijd gelijk aan 1, omdat dit de autocorrelatie tussen elke term en zichzelf vertegenwoordigt. Prijs en prijs met lag-nul zijn dezelfde variabele.
Elke piek die stijgt boven of onder de onderbroken lijnen valt, is statistisch significant. (Hoofdstuk 16 bespreekt dit in detail.) Dit betekent dat de spike een waarde heeft die significant verschilt van nul. Als een piek significant anders is dan nul, is dat een bewijs van autocorrelatie. Een piek die bijna nul is, is bewijs tegen autocorrelatie.
In dit voorbeeld zijn de spikes statistisch significant voor looptijden tot 24. Dit betekent dat de aandelenprijzen van Apple sterk gecorreleerd zijn met elkaar. Met andere woorden, wanneer de prijs van Apple-aandelen stijgt, blijft deze doorgaans stijgen.Wanneer de prijs van de Apple-aandelen daalt, neigt deze steeds verder te dalen. Deze figuur illustreert dit.
Tijdreeksplot van dagelijkse prijzen van Apple-aandelen.Hoewel de dagprijzen van Apple-aandelen sterk gecorreleerd zijn, is het dagelijkse rendement misschien niet. U berekent de dagelijkse opbrengsten van de dagprijzen als volgt:
waarbij
r t = Het continu samengestelde rendement op tijdstip t
P t = De prijs op tijd t
Pt -1 = De prijs op tijdstip t - 1 (een periode voor t)
ln = de natuurlijke logaritme
De natuurlijke logaritme is de logaritme met basis e, wat ongeveer gelijk is aan 2. 71828 ….
Deze figuur toont een autocorrelatieplot voor de dagelijkse aangiften naar Apple-aandelen van 1 januari 2013 tot 31 december 2013.
Autocorrelatieplot van dagelijkse aangiften naar Apple-aandelen.De autocorrelatieplot voor dagelijkse returns naar Apple-aandelen laat zien dat de meeste pieken niet statistisch significant zijn. Dit geeft aan dat de rendementen niet sterk gecorreleerd zijn, zoals hier wordt weergegeven.
De grafiek laat zien dat, met uitzondering van één grote daling, het rendement op Apple aandelen tussen 1 januari 2013 en 31 december 2013 vertonen geen specifiek patroon - ze fluctueren willekeurig rond nul. Dit betekent dat de rendementen grotendeels onafhankelijk van elkaar zijn.
U kunt een autocorrelatiegrafiek gebruiken om te bepalen of de elementen van een tijdreeks willekeurig zijn (dat wil zeggen, niet gerelateerd aan elkaar). Dit is belangrijk, omdat veel statistische tests met tijdreeksen op deze veronderstelling zijn gebaseerd.
Zoals u kunt zien, zijn er veel verschillende manieren om uw gegevens te visualiseren. Een foto zegt meer dan duizend woorden, zoals het gezegde luidt. En het geldt zeker in data-analyse. Statistische softwarepakketten zijn over het algemeen uitgerust met eenvoudig te gebruiken grafische hulpmiddelen. Door er gebruik van te maken, kunt u snel inzicht krijgen in uw gegevens die geen enkele hoeveelheid crunching u kan opleveren.