Inhoudsopgave:
- Hoe u rekenkundige bewerkingen uitvoert op kolommen met een dataframe
- Met de functie met () kunt u naar kolommen binnen een gegevensframe verwijzen zonder expliciet het dollarteken of zelfs de naam te gebruiken van het dataframe zelf. Dus, in ons voorbeeld, omdat u gebruikt met (iris, …) R weet beide Sepal te evalueren. Lengte en Sepal. Breedte in de context van iris.
Video: Weergaven opmaken 2024
Nadat u de juiste subset van uw gegevens hebt gemaakt, is de volgende stap in uw analyse waarschijnlijk het uitvoeren van enkele berekeningen met R.
Hoe u rekenkundige bewerkingen uitvoert op kolommen met een dataframe
R maakt het heel eenvoudig om berekeningen uit te voeren op kolommen van een dataframe, omdat elke kolom zelf een vector is. Blijf bij het iris dataframe en probeer een paar berekeningen op de kolommen uit te voeren. Bereken bijvoorbeeld de verhouding tussen de lengte en breedte van de kelkbladen:
Nu kunt u alle R-hulpmiddelen gebruiken om uw resultaat te bekijken. Inspecteer bijvoorbeeld de eerste vijf elementen van uw resultaten met de functie head (): >> head (x) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
Zoals u kunt zien, is het uitvoeren van berekeningen op kolommen van een gegevensframe eenvoudig. Houd er wel rekening mee dat elke kolom echt een vector is, dus u hoeft zich eenvoudigweg te herinneren hoe bewerkingen op vectoren moeten worden uitgevoerd.
Hoe met en binnen te gebruiken om de leesbaarheid van de code te verbeteren
Na een korte tijd schrijven van subsetinstructies in R, wordt u het typen van het dollarteken om kolommen uit een dataframe te extraheren beu.. Gelukkig is er een manier om de hoeveelheid typen te verminderen en om uw code tegelijkertijd leesbaarder te maken. De truc is om de functie met () te gebruiken. Probeer dit: >> y <- met (iris, kelklengte / kelkbreedte)Met de functie met () kunt u naar kolommen binnen een gegevensframe verwijzen zonder expliciet het dollarteken of zelfs de naam te gebruiken van het dataframe zelf. Dus, in ons voorbeeld, omdat u gebruikt met (iris, …) R weet beide Sepal te evalueren. Lengte en Sepal. Breedte in de context van iris.
Hopelijk ben je het ermee eens dat dit veel gemakkelijker te lezen en te begrijpen is. Door de waarden van uw nieuwe variabele y af te drukken, kunt u bevestigen dat deze in het vorige voorbeeld identiek is aan x. >> head (y) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
U kunt ook de identieke () functie gebruiken om R te laten zien of deze waarden zijn in feite hetzelfde:
Naast met (), kunt u met de handige functie within () eenvoudig waarden aan kolommen in uw gegevens toewijzen. Stel dat u de berekende verhouding tussen kelklengte en breedte wilt toevoegen aan het oorspronkelijke gegevenskader. U kent het al op deze manier: >> iris $ ratio <- iris $ Sepal. Lengte / iris $ Sepal. Breedte
Met gebruik van binnen () verandert het in het volgende: