Inhoudsopgave:
- Berekenen van het bereik
- Het bereik geeft u nog steeds slechts beperkte informatie. Vaak rapporteren statistici het eerste en het derde
- De standaardwaarde voor het argument probs is een vector die het minimum (0), het eerste kwartiel (0.25), de mediaan (0. 5), het derde kwartiel kwartiel (0. 75) en het maximum (1).
Video: Transforming Data - Data Analysis with R 2024
Naast het gemiddelde en de variatie, kun je ook de kwantielen in R. A quantile, of percentiel, vertelt u hoeveel van uw gegevens onder een bepaalde waarde liggen. De 50% -kwantiel, bijvoorbeeld, is hetzelfde als de mediaan. Nogmaals, R heeft een aantal handige functies om je te helpen de kwantielen te bekijken.
Berekenen van het bereik
De meest gebruikte kwantielen zijn eigenlijk de 0 procent en 100 procent kwantielen. Je kunt ze net zo gemakkelijk het minimum en maximum noemen, want dat zijn ze. U kunt beide samen krijgen met de bereik () functie. Deze functie geeft u gemakkelijk het bereik van de gegevens. Dus, om het bereik van de kilometers te kennen, doe je gewoon:
Berekening van de kwartielen
Het bereik geeft u nog steeds slechts beperkte informatie. Vaak rapporteren statistici het eerste en het derde
kwartiel samen met het bereik en de mediaan. Deze kwartielen zijn respectievelijk de 25% en 75% kwantielen, de getallen waarvoor een kwart en driekwart van de gegevens kleiner is. Je krijgt deze getallen met de functie quantile (), zoals deze:
Snel aan de slag met de quantile-functie
De quantile () -functie kan u elke gewenste quantiel geven. Daarvoor gebruikt u het argument probs. Je geeft de probs (of waarschijnlijkheden) als een fractioneel getal. Voor de 20 procent kwantiel, bijvoorbeeld, gebruikt u 0. 20 als een argument voor de waarde. Dit argument neemt ook een vector als waarde, dus je kunt bijvoorbeeld de kwantiteiten van 5 procent en 95 procent als volgt krijgen: >> quantile (auto's $ mpg, probs = c (0. 05, 0. 95)) 5% 95% 11. 995 31. 300De standaardwaarde voor het argument probs is een vector die het minimum (0), het eerste kwartiel (0.25), de mediaan (0. 5), het derde kwartiel kwartiel (0. 75) en het maximum (1).
Het argument na. Met rm kunt u alle NA-waarden verwijderen voordat u de respectieve statistiek berekent. Als u dit niet doet, krijgt elke vector met NA NA als gevolg. Dit werkt identiek aan de nvt. rm argument van de functie sum ().