Inhoudsopgave:
- De meest gebruikte kwantielen zijn eigenlijk de 0% en 100% kwantielen. Je kunt ze net zo gemakkelijk het minimum en maximum noemen, want dat zijn ze. U kunt zowel de min () als max () functies samen gebruiken met de range () functie. Deze functie geeft u gemakkelijk het bereik van de gegevens. Om dus te weten tussen welke twee waarden alle mijlen liggen, doet u eenvoudigweg het volgende:
- kwartiel
- Al deze functies hebben een argument nvt. rm waarmee u alle NA-waarden kunt verwijderen voordat u de respectieve statistiek berekent. Als u dit niet doet, krijgt elke vector met NA NA als gevolg. Dit werkt identiek aan de nvt. rm argument van de functie sum ().
Video: Elite: Dangerous Space Legs Community demo 2024
Een enkel nummer vertelt u niet veel over uw gegevens. Vaak is het net zo belangrijk om de verspreiding van uw gegevens te kennen. U kunt R gebruiken om deze spread te bekijken met behulp van een aantal verschillende benaderingen.
Eerst kunt u de standaarddeviatie of de standaardafwijking berekenen om de spreiding in een enkel getal samen te vatten. Daarvoor hebt u de handige functies var () voor de variantie en sd () voor de standaardafwijking. U berekent bijvoorbeeld de standaarddeviatie van de variabele mpg in de dataframes als volgt:
Naast het gemiddelde en de variatie, kun je ook de kwantielen bekijken. Een
quantiel, of een percentiel, vertelt je hoeveel van je gegevens onder een bepaalde waarde liggen. De 50% kwantiel is bijvoorbeeld niets anders dan de mediaan. Nogmaals, R heeft een aantal handige functies om je te helpen de kwantielen te bekijken. Gegevensbereik berekenen in R
De meest gebruikte kwantielen zijn eigenlijk de 0% en 100% kwantielen. Je kunt ze net zo gemakkelijk het minimum en maximum noemen, want dat zijn ze. U kunt zowel de min () als max () functies samen gebruiken met de range () functie. Deze functie geeft u gemakkelijk het bereik van de gegevens. Om dus te weten tussen welke twee waarden alle mijlen liggen, doet u eenvoudigweg het volgende:
Het bereik geeft u nog steeds slechts beperkte informatie. Vaak rapporteren statistici het eerste en het derde
kwartiel
naast het bereik en de mediaan. Deze kwartielen zijn respectievelijk de 25% en 75% kwantielen, de getallen waarvoor een kwart en driekwart van de gegevens kleiner is. Je krijgt deze getallen met de functie quantile (), zoals deze:
De quantile () -functie kan u elke gewenste quantiel geven. Daarvoor gebruikt u het argument probs. Je geeft de probs (of waarschijnlijkheden) als een fractioneel getal. Voor de 20 procent kwantiel, bijvoorbeeld, gebruikt u 0. 20 als een argument voor de waarde.Dit argument neemt ook een vector als waarde, dus je kunt bijvoorbeeld de kwantiteiten van 5 procent en 95 procent als volgt krijgen: >> quantile (auto's $ mpg, probs = c (0. 05, 0. 95)) 5% 95% 11. 995 31. 300
De standaardwaarde voor het argument probs is een vector die het minimum (0), het eerste kwartiel (0.25), de mediaan (0. 5), het derde kwartiel kwartiel (0. 75) en het maximum (1).