Inhoudsopgave:
Video: Hoe de vondst van vuurwerk leidde tot de komst van de EOD 2024
Een ggplot2 geom in R vertelt de plot hoe u uw gegevens wilt weergeven. U gebruikt bijvoorbeeld geom_bar () om een staafdiagram te maken. In ggplot2 kunt u verschillende vooraf gedefinieerde geoms gebruiken om standaard plottypen te maken.
Een geom bepaalt de lay-out van een ggplot2-laag. Er zijn bijvoorbeeld geoms om staafdiagrammen, scatterplots en lijndiagrammen te maken (evenals een aantal andere plots).
Elke geom heeft een standaardstatistiek en elke stat heeft een standaardgebe. In de praktijk hoeft u slechts één van deze te specificeren.
Geom | Beschrijving | Standaardstat |
---|---|---|
geom_bar () | Staafdiagram | stat_bin () |
geom_point () | Scatterplot | stat_identity () |
geom_line () | Lijndiagram, waarnemingen verbonden in volgorde van
x -waarde |
stat_identity () |
geom_boxplot | Box-and-whisker plot | stat_boxplot () |
geom_path | Lijndiagram, waarnemingen in oorspronkelijke volgorde verbinden | stat_identity () |
geom_smooth | Voeg een afgevlakt geconditioneerd gemiddelde toe | stat_smooth () |
geom_histogram | An alias voor geom_bar () en stat_bin () | stat_bin () |
Een staafdiagram maken met ggplot2 in R
Als u een staafdiagram wilt maken, gebruikt u de functie geom_bar (). Merk echter op dat de standaard stat stat_bin () is, die wordt gebruikt om uw gegevens in bins te knippen. Het standaardgedrag van geom_bar () is dus het maken van een histogram.
Als u bijvoorbeeld een histogram van de diepte van aardbevingen in de quakes-gegevensset wilt maken, doet u het volgende: >> ggplot (quakes, aes (x = depth)) + geom_bar ()> ggplot (quakes, aes (x = diepte)) + geom_bar (binwidth = 50)
Merk op dat uw toewijzing alleen de
x -as variabele definieert (in dit geval, quakes $ diepte). Een handig argument voor geom_bar () is binwidth, die de grootte van de laden bepaalt waar uw gegevens in worden gesneden.
In het volgende voorbeeld gebruikt u aggregate () om het aantal bevingen op verschillende diepteniveaus te berekenen: >> bevingen. agg-namen (aardbevingen, agg) <- c ("diepte", "mag")
Nu kun je de objectbevingen plotten. agg met geom_bar (stat = "identiteit"): >> ggplot (aardbevingen agg, aes (x = diepte, y = mag)) + + geom_bar (stat = "identiteit")
Samengevat, kunt u gebruik geom_bar () om een histogram te maken en ggplot2 uw gegevens te laten samenvatten, of u kunt uw gegevens vooraf samenvatten en vervolgens stat = "identity" gebruiken om een staafdiagram te plotten.
Een scatterplot maken in ggplot2
Als u een scatterplot wilt maken, gebruikt u de functie geom_point ().Een scatterplot maakt punten (of soms bubbels of andere symbolen) in uw grafiek. Elk punt komt overeen met een waarneming in uw gegevens.
Je hebt dit type afbeelding waarschijnlijk een miljoen keer gezien of gemaakt, dus je weet al dat scatterplots het cartesiaanse coördinatensysteem gebruiken, waarbij één variabele wordt toegewezen aan de
x
-as en een tweede variabele is toegewezen aan de
y -as. Op dezelfde manier maakt u in ggplot2 een toewijzing tussen x -as en
y -asvariabelen. Dus, om een plot van de aardbevingsgegevens te maken, breng je aardbevingen $ lang in kaart met de x -as en met $ lat naar de y -as: >> ggplot (aardbevingen, aes (x = lang, y = lat)) + geom_point () Hoe maak ik ggplot2 lijndiagrammen Om een lijndiagram te maken, gebruikt u de functie geom_line (). U gebruikt deze functie op een vergelijkbare manier als geom_point (), met het verschil dat geom_line () een lijn trekt tussen opeenvolgende punten in uw gegevens. Dit type diagram is handig voor tijdreeksgegevens in gegevensframes, zoals de populatiegegevens in de longley van de ingebouwde gegevensset. Om een lijndiagram van werkloosheidscijfers te maken, gebruikt u het volgende: >> ggplot (longley, aes (x = jaar, y = werklozen)) + geom_line ()