Video: 25 BRILJANTE OPLOSSINGEN VOOR EXTREME SITUATIES 2024
De cor () -functie in R kan ontbrekende gegevenswaarden op verschillende manieren verwerken. Daarvoor stelt u het argumentgebruik in op een van de mogelijke tekstwaarden. De waarde voor het argument use is vooral belangrijk als u de correlaties van de variabelen in een dataframe berekent. Door dit argument op verschillende waarden in te stellen, kunt u
-
Alle waarnemingen gebruiken door use = 'everything' in te stellen. Dit betekent dat als er een NA-waarde in een van de variabelen is, de resulterende correlatie ook NA is. Dit is de standaard.
-
Sluit alle waarnemingen met NA voor ten minste één variabele uit. Hiervoor stelt u use = 'completed in. obs'. Houd er rekening mee dat u hierdoor slechts enkele waarnemingen kunt doen als ontbrekende waarden worden verspreid via de volledige gegevensset.
-
Waarnemingen uitsluiten met NA -waarden voor elk paar variabelen dat u onderzoekt. Hiervoor stelt u het argument use = 'paarsgewijs' in. Dit zorgt ervoor dat u de correlatie voor elk paar variabelen kunt berekenen zonder informatie te verliezen vanwege ontbrekende waarden in de andere variabelen.
U kunt zelfs verschillende correlatiemetingen berekenen. R berekent standaard de standaard Pearson-correlatiecoëfficiënt. Voor gegevens die niet normaal worden gedistribueerd, kunt u de functie cor () gebruiken om de Spearman-rangcorrelatie of de tau van Kendall te berekenen. Hiervoor moet u het methode-argument instellen op de juiste waarde.