Huis Persoonlijke financiën Hoe samengevatte gegevens in een ggplot2 in R-dummies

Hoe samengevatte gegevens in een ggplot2 in R-dummies

Inhoudsopgave:

Video: Data Analysis in R by Dustin Tran 2024

Video: Data Analysis in R by Dustin Tran 2024
Anonim

Een zeer handige functie van ggplot2 is het bereik van functies om uw R-gegevens in de plot samen te vatten. Dit betekent dat u uw gegevens vaak niet vooraf hoeft te samenvatten. De hoogte van staven in een histogram geeft bijvoorbeeld aan hoeveel waarnemingen van iets u in uw gegevens hebt.

De statistische samenvatting hiervoor is het tellen van de waarnemingen. Statistici verwijzen naar dit proces als binning, en de standaardstatistiek voor geom_bar () is stat_bin ().

Analoog aan de manier waarop elke geom een ​​bijbehorende standaardstatistiek heeft, heeft elke stat ook een standaardgebe.

Dus dit roept de vraag op: Hoe beslis je of je een geom of een stat gebruikt? In theorie maakt het niet uit of je eerst de geom of de stat kiest. In de praktijk is het echter vaak intuïtief om eerst met een type plot te beginnen - met andere woorden, geef een geom op. Als je dan nog een laag statistische samenvatting wilt toevoegen, gebruik dan een stat.

In deze grafiek gebruikte u dezelfde gegevens om eerst een scatterplot met geom_point () te maken en vervolgens voegde u een vloeiende lijn toe met stat_smooth ().

Bekijk enkele praktische voorbeelden van het gebruik van statistische functies.

Stat Beschrijving Standaardgeom
stat_bin () Telt het aantal waarnemingen in bins. geom_bar ()
stat_smooth () Creëert een vloeiende lijn. geom_line ()
stat_sum () Voegt waarden toe. geom_point ()
stat_identity () Geen samenvatting. Geeft de gegevens weer zoals ze zijn. geom_point ()
stat_boxplot () Geeft een overzicht van de gegevens voor een box-and-whisker-plot. geom_boxplot ()
Gegevens in ggplot2

Je hebt al gezien hoe je stat_bin () kunt gebruiken om je gegevens samen te vatten in bins, omdat dit de standaard stat van geom_bar () is. Dit betekent dat de volgende twee coderegels identieke grafieken produceren: >> ggplot (aardbevingen, aes (x = diepte)) + geom_bar (binwidth = 50)> ggplot (aardbevingen, aes (x = diepte)) + stat_bin (binwidth = 50)

Hoe R-gegevens in ggplot2 glad te maken

Het ggplot2-pakket maakt het ook heel eenvoudig om regressielijnen door uw gegevens te creëren. U gebruikt de functie stat_smooth () om dit type lijn te maken.

Het interessante van stat_smooth () is dat het standaard gebruikmaakt van lokale regressie. R heeft verschillende functies die dit kunnen doen, maar ggplot2 gebruikt de loess () -functie voor lokale regressie. Dit betekent dat als u een lineair regressiemodel wilt maken, u stat_smooth () moet gebruiken om een ​​andere, vloeiendere functie te gebruiken. Dit doe je met het methode-argument.

Om het gebruik van een vloeiender te illustreren, begin met het creëren van een spreidingsdiagram van werkloosheid in de longley-gegevensset: >> ggplot (longley, aes (x = jaar, y = in dienst)) + geom_point ()

Volgende, voeg een vloeiendere toe.Dit is net zo eenvoudig als het toevoegen van stat_smooth () aan uw regel code. >> ggplot (longley, aes (x = jaar, y = in dienst)) + + geom_point () + stat_smooth ()

Vertel tenslotte stat_smooth om een ​​lineair regressiemodel te gebruiken. U doet dit door de argumentmethode = "lm" toe te voegen. >> ggplot (longley, aes (x = jaar, y = in dienst)) + + geom_point () + stat_smooth (methode = "lm")

Hoe u ggplot2 vertelt om uw gegevens ongecommariseerd te laten

Soms wil niet dat ggplot2 uw gegevens in de plot samenvat. Dit gebeurt meestal wanneer uw gegevens al vooraf zijn samengevat of wanneer elke regel van uw dataframe afzonderlijk moet worden geplot. In deze gevallen wil je ggplot2 vertellen om helemaal niets te doen, en de stat om dit te doen is stat_identity ().
Hoe samengevatte gegevens in een ggplot2 in R-dummies

Bewerkers keuze

Kennis van auditplanning nodig voor de AUD-test - dummies

Kennis van auditplanning nodig voor de AUD-test - dummies

Bij het nemen van de audit en het attest ( AUD) test op het CPA-examen, moet u blijk geven van kennis van het auditplanningsproces. Bij het plannen van een audit moet een auditor overwegen of bepaalde randvoorwaarden aanwezig zijn. Deze voorwaarden stellen de CPA-firma in staat om efficiënt een audit uit te voeren en de auditor te helpen bij het verkrijgen van voldoende ...

Passiva op de FAR-test van het CPA-examen - dummies

Passiva op de FAR-test van het CPA-examen - dummies

De financiële boekhouding en rapportage (FAR ) test van het CPA-onderzoek test u uw kennis van verschillende soorten verplichtingen inclusief opgebouwde verplichtingen, langlopende schulden, uitgestelde belastingen en pensioenverplichtingen. Lopende verplichtingen De periodetoerekeningsbasis boekt opbrengsten wanneer deze worden verdiend en neemt uitgaven op wanneer deze zijn gemaakt. De transactiebasis is niet afhankelijk van gelddeposito's ...

Regeling oefenvragen voor het CPA-examen - dummies

Regeling oefenvragen voor het CPA-examen - dummies

De verordening (REG) -test op het CPA-examen richt zich op op twee terreinen: ondernemingsrecht en belastingen. Overweeg flashcards te gebruiken om termen voor de REG-sectie te leren en te onthouden. Voordat u deze test uitvoert, moet u vele definities, feiten en cijfers verteren en flashcards kunnen een grote hulp zijn. Welke van de volgende ...

Bewerkers keuze

Met de AF-ON-knop op uw EOS 80D - dummies

Met de AF-ON-knop op uw EOS 80D - dummies

Als u nerveus bent over de ontspanknop tot halverwege op uw EOS 80D drukken, uit angst dat u per ongeluk een foto maakt, wilt u misschien kennis maken met de AF-ON-knop. In de geavanceerde belichtingsstanden (P, Tv, Av, M, B, C1 en C2), kun je deze knop ingedrukt houden om hetzelfde doel te bereiken als ...

Hoe je de opname maakt met de sfeer op je Canon EOS 80D - dummies

Hoe je de opname maakt met de sfeer op je Canon EOS 80D - dummies

Met je EOS 80D kun je een beetje spelen met kleur, scherpte, contrast en belichting in bepaalde scènemodi. De modus Shoot by Ambience kan leuk zijn voor een beetje experiment. Met de Picture Style-functie kunt u kiezen hoe de camera uw originele beeldgegevens "verwerkt" wanneer u een van de JPEG-afbeeldingen gebruikt ...

Hoe je de opname-informatieweergavemodus op je Canon EOS 80D gebruikt - dummies

Hoe je de opname-informatieweergavemodus op je Canon EOS 80D gebruikt - dummies

In de weergavemodus Opnamegegevens op uw EOS 80D wordt een miniatuur van uw afbeelding weergegeven, samen met scads aan opnamegegevens. Je ziet ook een helderheidshistogram - het grafiekachtige ding in de rechterbovenhoek van het scherm. (Denk eraan, druk gewoon op de Info-knop om door de weergavemodi te bladeren om deze te zien.) Hoe ...

Bewerkers keuze

Hoe Excel 2016-werkmappen te delen via OneDrive - dummies

Hoe Excel 2016-werkmappen te delen via OneDrive - dummies

Voordat u uw Excel 2016-werkmap kunt delen, moet een kopie ervan opslaan in een map op uw OneDrive. De eenvoudigste manier om dit te doen is om eerst de werkmap te openen om te delen in Excel en klik op de knop Delen die aan de rechterkant van het lint verschijnt. Excel opent vervolgens een ...

Hoe werkbladen delen in Excel 2013 - dummies

Hoe werkbladen delen in Excel 2013 - dummies

Excel 2013 maakt het gemakkelijk om uw spreadsheets te delen met vertrouwde klanten en collega's. U kunt de opties op het scherm Delen in de weergave Backstage gebruiken om werkbladen per e-mail te verzenden of per chatbericht te verzenden naar anderen die toegang hebben tot Excel. Als Microsoft Lync online vergaderingssoftware op uw apparaat is geïnstalleerd, maakt u ...

Hoe een werkblad in Windows te splitsen in Excel 2016 - dummies

Hoe een werkblad in Windows te splitsen in Excel 2016 - dummies

Hoewel in en uit zoomen op een Excel 2016-werkblad kan je helpen om je te oriënteren, het kan niet twee afzonderlijke secties samenbrengen zodat je hun gegevens op het scherm kunt vergelijken (in ieder geval niet op een normale grootte waar je de informatie daadwerkelijk kunt lezen). Om dit soort truc te beheren, splitst u de ...