Inhoudsopgave:
- Eén variabele toevoegen
- Hoewel de rijnamen van de gegevensframes nieuw zijn. df en manden. df verschillen, R zal dit negeren en alleen de rijnamen van het eerste dataframe gebruiken in de functie cbind (), zoals u kunt zien aan de uitgang van de volgende code: >> head (cbind (baskets. df, new df), 4) Granny Geraldine Gabrielle Gertrude Guinevere 1st 12 5 11 3 6 2nd 4 4 5 5 9 3rd 5 2 6 2 7 4th 6 4 7 1 3
Video: Data Analysis in R by Dustin Tran 2024
Een dataframe kan worden uitgebreid met nieuwe variabelen in R. U kunt bijvoorbeeld gegevens ophalen van een andere speler in het Granny-team. Of u wilt misschien een nieuwe variabele uit de andere variabelen in de dataset berekenen, zoals de totale som van de manden die in elk spel zijn gemaakt.
Eén variabele toevoegen
Er zijn drie manieren om een variabele toe te voegen. Vergelijkbaar met het geval van het toevoegen van waarnemingen, kunt u de functie cbind () of de indexen gebruiken.
Je kunt ook het dollarteken gebruiken om een extra variabele toe te voegen. Stel je voor dat Granny je vroeg om het aantal manden van haar vriend Gabrielle aan het dataframe toe te voegen. Eerst zou je een vector creëren met die gegevens zoals deze: >> manden. van. Gabrielle <- c (11, 5, 6, 7, 3, 12, 4, 5, 9)
Om een extra variabele genaamd Gabrielle met die gegevens te maken, doe je eenvoudigweg het volgende: >> manden. df $ Gabrielle <- baskets. van. Gabrielle
Als je wilt controleren of dit werkte, maar je wilt niet het volledige dataframe weergeven, zou je de head () -functie kunnen gebruiken. Voor deze functie zijn twee argumenten nodig: het object dat u wilt weergeven en het aantal rijen dat u wilt zien. Om de eerste vier rijen van het nieuwe dataframe te zien, manden. df, gebruik de volgende code:
>> hoofd (manden. Df, 4) Granny Geraldine Gabrielle 1st 12 5 11 2nd 4 4 5 3rd 5 2 6 4th 6 4 7
Meerdere variabelen toevoegen met cbind
U kunt Beweer dat uw dataframe een matrix is en gebruik de functie cbind () om dit te doen. In tegenstelling tot wanneer u rbind () op gegevensframes gebruikt, hoeft u zich niet eens zorgen te maken over de rij- of kolomnamen. Laten we een nieuw dataframe maken met de doelen voor Gertrude en Guinevere. Om beide te combineren in een dataframe, probeer:>> nieuw. df <- gegevens. frame (+ Gertrude = c (3, 5, 2, 1, NA, 3, 1, 1, 4), + Guinevere = c (6, 9, 7, 3, 3, 6, 2, 10, 6) +)
Hoewel de rijnamen van de gegevensframes nieuw zijn. df en manden. df verschillen, R zal dit negeren en alleen de rijnamen van het eerste dataframe gebruiken in de functie cbind (), zoals u kunt zien aan de uitgang van de volgende code: >> head (cbind (baskets. df, new df), 4) Granny Geraldine Gabrielle Gertrude Guinevere 1st 12 5 11 3 6 2nd 4 4 5 5 9 3rd 5 2 6 2 7 4th 6 4 7 1 3
Bij gebruik van een dataframe of een matrix met kolomnamen, R zal die gebruiken als de namen van de variabelen. Als u cbind () gebruikt om een vector aan een dataframe toe te voegen, gebruikt R de vectornaam als een variabelenaam, tenzij u er zelf een specificeert, zoals u deed met rbind ().
Als u een matrix zonder kolomnamen aan het dataframe koppelt, gebruikt R automatisch de kolomnummers als namen.Dat levert echter een beetje problemen op, omdat gewone getallen ongeldige objectnamen zijn en dus moeilijker te gebruiken als variabelenamen. In dit geval kunt u de indices beter gebruiken.Telkens wanneer u een dataframe wilt gebruiken en niet voortdurend de naam moet invoeren gevolgd door $, kunt u de functies gebruiken met () en binnen (). Met de functie within () kunt u ook gemakkelijk variabelen aan een dataframe toevoegen.