Inhoudsopgave:
Video: ggplot2 tutorial: stats and geoms 2024
gebruiken Een ggplot2-geom vertelt de plot hoe u uw gegevens in R wilt weergeven. U gebruikt bijvoorbeeld geom_bar () om een staafdiagram te maken. In ggplot2 kunt u verschillende vooraf gedefinieerde geoms gebruiken om standaard plottypen te maken.
Een geom bepaalt de lay-out van een ggplot2-laag. U kunt bijvoorbeeld geoms gebruiken om staafdiagrammen, scatterplots en lijndiagrammen te maken (evenals een aantal andere plots), zoals u hieronder kunt zien.
Elke geom heeft een standaardstatistiek, en elke stat heeft een standaardgebe. In de praktijk hoeft u slechts één van deze te specificeren.
Geom | Beschrijving | Standaardstat |
---|---|---|
geom_bar () | staafdiagram | stat_bin () |
geom_point () | Scatterplot | stat_identity () |
geom_line () | Lijndiagram, waarnemingen aansluiten op volgorde van
x -waarde |
stat_identity () |
geom_boxplot | Box-and-whisker plot | stat_boxplot () |
geom_path | Lijndiagram, waarnemingen in oorspronkelijke volgorde verbinden | stat_identity () |
geom_smooth | Een afgevlakt geconditioneerd gemiddelde toevoegen | stat_smooth () |
geom_histogram | Een alias voor geom_bar () en stat_bin () | stat_bin () |
Een staafdiagram maken
Als u een staafdiagram wilt maken, gebruikt u de functie geom_bar (). Houd er echter rekening mee dat de standaardstat stat_bin () is, die wordt gebruikt om uw gegevens in bins te knippen. Het standaardgedrag van geom_bar () is dus het maken van een histogram.
Probeer bijvoorbeeld om een histogram van de diepte van aardbevingen in de quakes-gegevensset te maken: >> ggplot (quakes, aes (x = depth)) + geom_bar ()> ggplot (quakes, aes (x = depth)) + geom_bar (binwidth = 50)
Merk op dat je mapping alleen de
x -as variabele definieert (in dit geval, quakes $ depth). Een handig argument voor geom_bar () is binwidth, die de grootte van de laden bepaalt waar uw gegevens in worden gesneden. Hiermee wordt deze plot gemaakt.
In het volgende voorbeeld gebruikt u aggregate () om het aantal bevingen op verschillende diepteniveaus te berekenen: >> aardbevingen agg namen (aardbevingen, agg) <- c ("diepte", "mag")
Nu kun je de objectbevingen plotten. agg met geom_bar (stat = "identiteit"): >> ggplot (bevingen. agg, aes (x = diepte, y = mag)) + + geom_bar (stat = "identiteit")
Samenvattend, je kunt geom_bar () gebruiken om een histogram te maken en ggplot2 je gegevens te laten samenvatten, of je kunt samenvatten uw gegevens en gebruik dan stat = "identiteit" om een staafdiagram uit te zetten.
Een scatterplot maken
Als u een scatterplot wilt maken, gebruikt u de functie geom_point (). Een scatterplot maakt punten (of soms bubbels of andere symbolen) in uw grafiek. Elk punt komt overeen met een waarneming in uw gegevens.
Je hebt dit type afbeelding waarschijnlijk een miljoen keer gezien of gemaakt, dus je weet al dat scatterplots het cartesiaanse coördinatensysteem gebruiken, waarbij één variabele wordt toegewezen aan de
x
-as en een tweede variabele is toegewezen aan de
y -as. Op dezelfde manier maakt u in ggplot2 een toewijzing tussen x -as en
y -asvariabelen. Dus, om een plot van de aardbevingsgegevens te maken, breng je aardbevingen $ lang in kaart met de x -as en met $ lat naar de y -as: >> ggplot (aardbevingen, aes (x = lang, y = lat)) + geom_point () Hiermee wordt deze scatterplot gemaakt. geom_point (). "Width =" 535 "> Een scatterplot maken met geom_point ().
Lijndiagrammen maken
Als u een lijndiagram wilt maken, gebruikt u de functie geom_line (). U gebruikt deze functie op een vergelijkbare manier naar geom_point (); het verschil is dat geom_line () een lijn trekt tussen opeenvolgende punten in uw gegevens.
Dit type diagram is handig voor tijdreeksgegevens in gegevensframes, zoals de populatiegegevens in de ingebouwde gegevensset Voor het maken van een lijndiagram met werkloosheidscijfers gebruikt u het volgende: >> ggplot (longley, aes (x = jaar, y = werklozen)) + geom_line () Hiermee wordt deze regel gemaakt.geom_line (). "width =" 535 ">
Een lijndiagram tekenen met geom_line ().
U kunt geom_line () of geom_path () gebruiken om een lijntekening te maken in ggplot2. Het verschil is dat geom_line () eerst de waarnemingen ordent volgens
x
-waarde, terwijl geom_path () de waarnemingen in de volgorde tekent die in de gegevens wordt gevonden.