Inhoudsopgave:
Video: How to import data in R 2024
Om een duidelijker beeld te krijgen van hoe uw gegevens binnen het bereik worden gedistribueerd, kunt u een histogram plotten met R. Om een histogram voor de kilometerstandgegevens te maken, gebruikt u eenvoudig de hist () -functie, zoals deze: >> hist (auto's $ mpg, col = "grijs")
U ziet dat de functie hist () voor het eerst snijdt het bereik van de gegevens in een aantal even intervallen en telt vervolgens het aantal waarnemingen in elk interval. De hoogte van de staven is evenredig met die frequenties. Op de
y -as vindt u de tellingen.
Spelen met pauzes
R kiest het aantal intervallen dat het meest nuttig lijkt om de gegevens weer te geven, maar u kunt het niet eens zijn met wat R doet en zelf de pauzes kiezen. Hiervoor gebruikt u het argument pauzes van de functie hist ().
U kunt R het aantal gewenste balken in het histogram vertellen door een enkel getal als argument op te geven.
-
Houd er rekening mee dat R nog steeds zal beslissen of dat redelijk is en probeert het bereik te verkleinen met mooie afgeronde getallen. U kunt R precies vertellen waar de onderbrekingen moeten worden geplaatst door een vector met de breekpunten als waarde voor het argument
-
onderbrekingen op te geven.
Dus, als je het niet eens bent met R en je wilt staven die de intervallen 5 tot 15, 15 tot 25 en 25 tot 35 voorstellen, dan kun je dit doen met de volgende code: >> hist (auto's $ mpg, onderbrekingen = c (5, 15, 25, 35))
U kunt ook de naam opgeven van het algoritme R dat moet worden gebruikt om het aantal onderbrekingen te bepalen als de waarde voor de verbreekt argument. U vindt meer informatie over deze algoritmen op de Help-pagina? hist. Probeer een beetje met die algoritmen te experimenteren om te controleren welke het beste werkt.