Zijn de elementen in de dataset ongecorreleerd? - dummies

Video: How to Learn from Little Data - Intro to Deep Learning #17 2024

Voor een gegevensset die bestaat uit waarnemingen die op verschillende tijdstippen zijn gedaan (dat wil zeggen, tijdreeksgegevens ), is het belangrijk om te bepalen of de waarnemingen al dan niet aan elkaar gecorreleerd zijn. Dit komt omdat veel technieken voor het modelleren van tijdreeksgegevens zijn gebaseerd op de aanname dat de gegevens niet met elkaar zijn gecorreleerd (onafhankelijk).

Een grafische techniek die u kunt gebruiken om te zien of de gegevens niet-gecorreleerd zijn, is de autocorrelatiefunctie. De autocorrelatiefunctie toont de correlatie tussen waarnemingen in een tijdreeks met verschillende vertragingen. De correlatie tussen waarnemingen met lag 1 verwijst bijvoorbeeld naar de correlatie tussen elke individuele waarneming en de vorige waarde.

Deze figuur toont de autocorrelatiefunctie voor de dagelijkse aangiften van ExxonMobil in 2013.

Autocorrelatiefunctie van dagelijkse terugkeer naar ExxonMobil-aandelen in 2013.

Elke "piek" in de autocorrelatiefunctie vertegenwoordigt de correlatie tussen observaties met een bepaalde vertraging.

De autocorrelatie met lag 0 is altijd gelijk aan 1, omdat dit de correlaties van de observaties met zichzelf vertegenwoordigt.

In de grafiek stellen de onderbroken lijnen de onder- en bovengrenzen voor van een betrouwbaarheidsinterval. Als een piek boven de bovengrens van het betrouwbaarheidsinterval komt of onder de ondergrens van het betrouwbaarheidsinterval valt, toont dat aan dat de correlatie voor die vertraging niet 0 is. Dit is bewijs tegen de onafhankelijkheid van de elementen in een dataset.

In dit geval is er slechts één statistisch significante piek (bij lag 8). Deze piek laat zien dat het rendement van ExxonMobil mogelijk onafhankelijk is. Een meer formele statistische test zou uitwijzen of dat waar is of niet.