Inhoudsopgave:
- Twee gegevensvoorbeelden vergelijken
- In de meeste gevallen wilt u niet twee monsters met elkaar vergelijken, maar een monster vergelijken met een theoretisch monster dat komt van een bepaalde verdeling (bijvoorbeeld de normale verdeling).
Video: Creating and Interpreting Normal Q-Q Plots in SPSS 2024
Histogrammen laten veel over aan de interpretatie van de kijker. Een betere grafische manier in R om te bepalen of uw gegevens normaal verdeeld zijn, is door naar een zogenaamde kwantiel-kwantiel (QQ) plot te kijken.
Met deze techniek plot je kwantielen tegen elkaar. Als u bijvoorbeeld twee monsters vergelijkt, vergelijkt u eenvoudig de kwantielen van beide monsters. Of, om het een beetje anders te stellen, R doet het volgende om een QQ-plot te construeren:
-
Het sorteert de gegevens van beide monsters.
-
Het plot deze gesorteerde waarden tegen elkaar.
Als beide steekproeven niet hetzelfde aantal waarden bevatten, berekent R extra waarden door interpolatie voor het kleinste monster om twee steekproeven van dezelfde grootte te maken.
Twee gegevensvoorbeelden vergelijken
Natuurlijk hoeft u dat niet alleen te doen, u kunt daarvoor eenvoudig de qqplot () -functie gebruiken. Om dus te controleren of de temperaturen tijdens activiteit en tijdens rust gelijk verdeeld zijn, doet u eenvoudigweg het volgende:
Hiermee wordt een plot gemaakt waarin de geordende waarden worden geplot tegen elkaar.
Tussen de vierkante haken kunt u een logische vector gebruiken om de gewenste cases te selecteren. Hier selecteert u alle gevallen waarin de variabele activ gelijk is aan 1 voor de eerste steekproef en alle gevallen waarin die variabele gelijk is aan 0 voor de tweede steekproef.
In de meeste gevallen wilt u niet twee monsters met elkaar vergelijken, maar een monster vergelijken met een theoretisch monster dat komt van een bepaalde verdeling (bijvoorbeeld de normale verdeling).
Om een QQ-plot op deze manier te maken, heeft R de speciale qqnorm () -functie. Zoals de naam aangeeft, plot je met deze functie je steekproef tegen een normale verdeling. U geeft eenvoudig het voorbeeld dat u wilt plotten als eerste argument en voegt de gewenste grafische parameters toe.
R maakt vervolgens een steekproef met waarden afkomstig van de normale
standaard normale verdeling, of een normale verdeling met een gemiddelde van nul en een standaardafwijking van één. Met dit tweede voorbeeld maakt R de QQ-plot zoals eerder uitgelegd. R heeft ook een qqline () -functie, die een regel toevoegt aan uw normale QQ-plot. Deze regel maakt het een stuk eenvoudiger om te evalueren of je een duidelijke afwijking van de normaliteit ziet. Hoe dichter alle punten bij de lijn liggen, hoe dichter de verdeling van uw sample bij de normale verdeling komt. De qqline () -functie neemt de sample ook als een argument.
Nu wilt u dit doen voor de temperaturen tijdens zowel de actieve als de inactieve periode van de bever. U kunt de qqnorm () -functie twee keer gebruiken om beide plots te maken. Voor de inactieve periodes kun je de volgende code gebruiken: >> qqnorm (beaver2 $ temp [beaver2 $ activ == 0], main = "Inactive")> qqline (beaver2 $ temp [beaver2 $ activ == 0])
U kunt hetzelfde doen voor de actieve periode door de waarde 0 te wijzigen in 1.