Video: R tutorial - Learn How to Subset, Extend & Sort Data Frames in R 2024
Vectoren, lijsten en gegevensframes spelen een belangrijke rol bij het weergeven van gegevens in R, dus het is belangrijk om beknopt en correct een subset van uw gegevens te specificeren.
Er zijn drie hoofdoperatoren die u kunt gebruiken om uw gegevens te subsetten:
-
$: extraheer een enkel element op naam uit een lijst of dataframe. Bijvoorbeeld, iris $ Sepal. Lengte extraheert de kolom Sepal. Lengte van de dataframe iris.
-
[[: extraheert een enkel element op naam of positie uit een lijst of gegevensframe. Bijvoorbeeld, iris [["Sepal. Lengte "]] extraheert de kolom Sepal. Lengte van het dataframe; iris; iris [[2]] haalt het tweede element uit de iris.
-
[: extra elementen uit een vector, matrix, lijst of gegevensframe extraheren. Met iris [c ("Sepal. Length", "Species") worden de kolommen Sepal geëxtraheerd. Lengte en soorten van iris; iris [1: 10,] haalt de eerste tien rijen uit de iris; en iris [1: 10, "Soort"] extraheert de eerste tien elementen van de kolom Soorten van iris.
Met de bracket-subset-operator [kunt u meerdere elementen retourneren. U geeft de subset op een van de volgende vijf manieren op:
-
Blanco: Retourneert alles. Iris [] retourneert bijvoorbeeld de hele iris.
-
Positief cijfer: bevat alleen deze elementen. Iris [1: 100, 5] extraheert bijvoorbeeld de eerste honderd elementen van de vijfde kolom met iris.
-
Negatief cijfer: sluit deze elementen uit. Bijvoorbeeld: iris [- (1: 100),] sluit de eerste honderd rijen van iris uit, terwijl iris [-5] de vijfde kolom uitsluit van iris.
-
Logisch: Inclusief als TRUE; sluit als ONWAAR. Iris [iris $ Species == "setosa",] haalt bijvoorbeeld alleen die rijen uit iris waar de waarde van Soort "setosa" is.
-
Naam: Omvat alle namen die overeenkomen. Bijvoorbeeld, iris [c ("Soort", "Bloemblaaddek. Breedte")] extraheert de kolommen Soort en Bloemblaadje. Breedte van iris.