Huis Persoonlijke financiën Hoe Suss Statistieken in ggplot2 in R-dummies

Hoe Suss Statistieken in ggplot2 in R-dummies

Inhoudsopgave:

Video: RStudio basics of R Markdown 2024

Video: RStudio basics of R Markdown 2024
Anonim

Na data, mapping en geoms beschrijft het vierde element van een ggplot2-laag in R hoe de gegevens moeten worden samengevat. In ggplot2 verwijs je naar deze statistische samenvatting als een stat.

Een zeer handige functie van ggplot2 is het bereik van functies om uw gegevens in de plot samen te vatten. Dit betekent dat u uw gegevens vaak niet vooraf hoeft te samenvatten. De hoogte van staven in een histogram geeft bijvoorbeeld aan hoeveel waarnemingen van iets u in uw gegevens hebt. De statistische samenvatting hiervoor is om de waarnemingen te tellen. Statistici verwijzen naar dit proces als binning, en de standaardstatistiek voor geom_bar () is stat_bin ().

Analoog aan de manier waarop elke geom een ​​bijbehorende standaardstatistiek heeft, heeft elke stat ook een standaardgebe.

Dus dit roept de vraag op: Hoe beslis je of je een geom of een stat gebruikt? In theorie maakt het niet uit of je eerst de geom of de stat kiest. In de praktijk is het echter vaak intuïtief om eerst met een type plot te beginnen - met andere woorden, geef een geom op. Als je dan nog een laag statistische samenvatting wilt toevoegen, gebruik dan een stat.

geom_bar (). "Width =" 535 ">

Een histogram maken met geom_bar ().

In deze grafiek gebruikte u dezelfde gegevens om eerst een scatterplot met geom_point () te maken en vervolgens voegde u een vloeiende lijn toe met stat_smooth ().

Hier enkele praktische voorbeelden van het gebruik van statistische functies.

Stat Beschrijving Standaardgeom
stat_bin () Telt het aantal waarnemingen in bins. geom_bar ()
stat_smooth () Creëert een vloeiende lijn. geom_line ()
stat_sum () Voegt waarden toe. geom_point ()
stat_identity () Geen samenvatting. Plot gegevens zoals het is. geom_point ()
stat_boxplot () geeft een overzicht van de gegevens voor een box-and-whisker-plot geom_boxplot ()
> Binning-gegevens

U hebt stat_bin () al gezien om uw gegevens samen te vatten in bins, omdat dit de standaardstat van geom_bar () is. Dit betekent dat de volgende twee coderegels identieke plots produceren: >> ggplot (aardbevingen, aes (x = diepte)) + geom_bar (binwidth = 50)> ggplot (aardbevingen, aes (x = diepte)) + stat_bin (binwid th = 50)

Smoothing-gegevens

Het ggplot2-pakket maakt het ook heel eenvoudig om regressielijnen door uw gegevens te maken. U gebruikt de functie stat_smooth () om dit type lijn te maken.

Het interessante van stat_smooth () is dat het standaard gebruikmaakt van lokale regressie. R heeft verschillende functies die dit kunnen doen, maar ggplot2 gebruikt de loess () -functie voor lokale regressie. Dit betekent dat als u een lineair regressiemodel wilt maken, u stat_smooth () moet vertellen om een ​​andere, vloeiender functie te gebruiken.Dit doe je met het methode-argument.

Om het gebruik van een vloeiender te illustreren, begint u met het creëren van een spreidingsdiagram van werkloosheid in de longley-gegevensset: >> p p

Voeg vervolgens een vloeiendere toe. Dit is net zo eenvoudig als het toevoegen van stat_smooth () aan uw regel code. >> p + stat_smooth ()

Uw afbeelding moet er uitzien als de grafiek links van de afbeelding hieronder.

Soms genereert ggplot2 berichten met extra tips en informatie. Zolang u geen waarschuwing of fout ziet, kunt u deze berichten veilig negeren. In dit geval vertelt stat_smooth () u dat de standaardsoepellere methode is

löss

(lokale afvlakking). Het bericht zegt ook dat u alternatieve verzachtingsmethoden kunt gebruiken.

Gebruik ten slotte stat_smooth () om een ​​lineair regressiemodel te passen en uit te zetten. U doet dit door de argumentmethode = "lm" toe te voegen: >> p + stat_smooth (methode = "lm")

Uw afbeelding moet er nu uitzien als de plot aan de rechterkant. stat_smooth (). "Width =" 535 "> Regressielijnen toevoegen met stat_smooth ().

Niets doen met identiteit

Soms wilt u niet dat ggplot2 uw gegevens in de plot samenvat. Dit gebeurt meestal wanneer uw gegevens zijn al vooraf samengevat of wanneer elke regel van uw dataframe afzonderlijk moet worden geplot. In deze gevallen wilt u ggplot2 niets doen, en de stat om dit te doen is stat_identity (). U hebt waarschijnlijk opgemerkt dat stat_identity is de standaardstatistiek voor punten en lijnen.
Hoe Suss Statistieken in ggplot2 in R-dummies

Bewerkers keuze

Key Taoists in History - dummies

Key Taoists in History - dummies

De oorsprong van het taoïsme reikt terug tot het prehistorische China, en heeft een sterke invloed gehad over de Chinese cultuur in de loop van zijn geschiedenis. De volgende mensen vormden het Taoïsme in de tijd en maakten het tot wat het nu is: Lao Tzu: Lao Tzu is de traditionele & ldquo; oprichter & rdquo; van het taoïsme en de befaamde auteur van de Tao Te Ching. ...

Woorden die worden gebruikt om religieuze twijfel te beschrijven en te labelen - dummies

Woorden die worden gebruikt om religieuze twijfel te beschrijven en te labelen - dummies

Atheïsme en andere soorten religieuze twijfel zijn verworden a-blok met labels en voorwaarden. Sommige zijn belangrijker dan andere; sommige zijn neutraal of positief; anderen worden gebruikt (zelfs door atheïsten) als putdowns. De volgende lijst bevat alle belangrijke labels: goed, slecht en lelijk. Atheist: Gelooft niet dat er een god of goden bestaat. Agnostisch: ...

Basisbeginselen van tools voor het bewerken van mobiele foto's voor visuele sociale marketing - dummies

Basisbeginselen van tools voor het bewerken van mobiele foto's voor visuele sociale marketing - dummies

Met meer en meer mensen gebruikmakend van hun smartphones om foto's te maken voor visuele sociale marketing, is het niet verrassend dat veel toepassingen voor het bewerken van mobiele telefoons beschikbaar zijn. Dit zijn de voordelen van het gebruik van mobiele bewerkings-apps: ze zijn meestal gemakkelijk te gebruiken. Ze kosten meestal minder dan $ 5. Ze hebben unieke filters en bewerken ...

Bewerkers keuze

Hoe u metrics vermijdt met uw website Analytics-gegevens - dummies

Hoe u metrics vermijdt met uw website Analytics-gegevens - dummies

U kunt zich afvragen hoe ter wereld je fouten kunt maken met gegevens die in nette rapporten en grafieken aan je worden geleverd. Social media-metricservices doen er alles aan om alle en alle gegevens die u hen opgeeft, te verzamelen. Er zijn veel valkuilen voor statistieken. U kunt eenvoudig ...

Hoe codes en patronen voor sociale media te ontcijferen - dummies

Hoe codes en patronen voor sociale media te ontcijferen - dummies

Terwijl u uw sociale netwerk volgt media-metrieken in de loop van de tijd en beginnen met het gebruik van enkele van de volgende laag-hulpmiddelen, zoals segmentatie en dayparting, om uw online en sociale interactie te analyseren, het is belangrijk om uw oog te houden op patronen van gebruik, interesse en betrokkenheid en de geheime codes uw bezoekers en fans / volgers sturen ...

Hoe u uw Klout-account verwijdert - dummies

Hoe u uw Klout-account verwijdert - dummies

Als u besluit dat u niet langer wenst deel te nemen aan Klout, je kunt je volledig afmelden door naar de opt-outpagina op Klout te gaan. com. Omdat Klout openbare informatie gebruikt die van het internet is gehaald, kan het zijn dat er al wat gegevens voor u zijn opgeslagen, zelfs als u zich niet voor Klout hebt aangemeld. Of u nu wel of niet ...

Bewerkers keuze

Het tabblad Lettertype gebruiken in Word 2007 - dummies

Het tabblad Lettertype gebruiken in Word 2007 - dummies

Het tabblad Lettertype in het lettertype Word 2007 Het dialoogvenster bevat veel opdrachten voor het opmaken van tekst, waaronder enkele die u niet kunt openen via de groep Lettertype op het tabblad Start. U kunt bijvoorbeeld ook effecten zoals schaduwen en embossing toevoegen en een voorbeeld van de resultaten bekijken voordat u ze toepast. Roep het dialoogvenster Lettertype op. ...

Hoe u de opdracht Go To gebruikt in Word 2007 - dummies

Hoe u de opdracht Go To gebruikt in Word 2007 - dummies

Gebruikt u de opdracht Ga naar in Word 2007 om de invoegwijzer naar een specifieke pagina of regel te sturen of naar de locatie van een aantal interessante dingen die Word mogelijk in uw document kan invoegen.

Hoe de opdracht Ga naar Commando te gebruiken in Word 2016 - dummies

Hoe de opdracht Ga naar Commando te gebruiken in Word 2016 - dummies

U om de invoegwijzer naar een specifieke pagina of regel te sturen of naar de locatie van een aantal interessante items die Word mogelijk in uw document kan proppen. De opdracht Ga naar is je tekstverwerkende teleporter naar elke willekeurige locatie. Ga als volgt te werk om de opdracht Ga naar te gebruiken: ...