Video: WW2 - OverSimplified (Part 1) 2024
U hebt de gegevensset en hebt deze opgemaakt om aan uw behoeften te voldoen in R, dus nu ben je klaar voor het echte werk. Analyse van uw gegevens begint altijd met een beschrijving ervan. Op deze manier kunt u fouten in de gegevens detecteren en kunt u beslissen welke modellen geschikt zijn om de informatie te krijgen die u nodig heeft uit de gegevens die u hebt.
Welke beschrijvende statistieken u gebruikt, hangt natuurlijk af van de aard van uw gegevens.
Soms bent u meer geïnteresseerd in het algemene beeld van uw gegevens dan in de afzonderlijke waarden. U bent wellicht niet geïnteresseerd in de kilometerstand van elke auto, maar in de gemiddelde kilometerstand van alle auto's uit die gegevensset. Hiervoor berekent u het gemiddelde met behulp van de functie mean (), zoals deze: >> mean (cars $ mpg) [1] 20. 09062
U zou ook het gemiddelde aantal cilinders van die auto's kunnen berekenen, maar dit is niet echt logisch. Het gemiddelde zou 6. 1875 cilinders zijn, en geen auto's drijven met een onvolledige cilinder. In dit geval is de
mediaan - de meest centrale waarde in uw gegevens - logischer. U krijgt de mediaan van het gebruik van de functie median (), zoals deze: