Video: Data Analysis in R by Dustin Tran 2024
U gebruikt dezelfde indexeerregels voor karaktervectoren die u gebruikt voor numerieke vectoren (of voor vectoren van elk type). Het verwijzen naar een subset van een vector door het indexeren van de elementen wordt ook subsetting genoemd. Met andere woorden, subsetting is het proces waarbij een subset van een vector wordt geëxtraheerd.
Gebruik de ingebouwde BR letters en BRIEVEN om te illustreren hoe u werkt met vectoren en specifiek hoe u subsets maakt. Beide zijn karaktervectoren die bestaan uit de letters van het alfabet, in kleine letters (letters) en hoofdletters (LETTERS). Probeer het:
Behalve nuttig te zijn om het gebruik van subsets te illustreren, je kunt deze ingebouwde vectoren gebruiken wanneer je een lijst met dingen moet maken.
Gebruik de volgende om de laatste drie elementen van LETTERS te krijgen: >> LETTERS [24: 26] [1] "X" "Y" "Z"
De dubbelepuntoperator (:) in R is een handige manier om reeksen te maken, dus 24: 26 resulteert in 25, 25, 26. Wanneer dit verschijnt binnen de vierkante haakjes, R geeft elementen 24 tot en met 26 terug.
In ons laatste voorbeeld was het gemakkelijk om de laatste drie letters van LETTERS te extraheren, omdat je weet dat het alfabet 26 letters bevat. Heel vaak weet u de lengte van een vector niet. U kunt de functie tail () gebruiken om de volgelementen van een vector weer te geven. Om de laatste vijf elementen van LETTERS te krijgen, probeer je het volgende: >> staart (LETTERS, 5) [1] "V" "W" "X" "Y" "Z"
Je kunt ook het volgende gebruiken: head () functie om het eerste element van een variabele te krijgen. Standaard retourneren zowel head () als tail () zes elementen, maar u kunt aangeven dat het een specifiek aantal elementen in het tweede argument retourneert. Probeer de eerste tien letters uit te pakken: >> kop (letters, 10) [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j"