Video: Index en Vergelijken: alternatief voor verticaal zoeken 2024
Wanneer u met tekst in R werkt, moet u mogelijk woorden of patronen in de tekst zoeken. Stel je voor dat je een lijst hebt van de staten in de Verenigde Staten, en je wilt weten welke namen van staten uit twee woorden bestaan.
Om subtekenreeksen te vinden, kunt u de functie grep () gebruiken, die twee essentiële argumenten vergt:
-
patroon : Het patroon dat u wilt vinden.
-
x : De tekenvector die u wilt zoeken.
Dus, hoe vind je de namen van alle staten met meer dan één woord? Dit is gemakkelijk als je je realiseert dat je de vraag kunt kaderen door al die toestanden te vinden die een spatie bevatten: >> staat. naam [grep ("", staat. naam)] [1] "New Hampshire" "New Jersey" [3] "New Mexico" "New York" [5] "Noord-Carolina" "Noord-Dakota" [7] "Rhode Eiland "" South Carolina "[9]" South Dakota "" West Virginia "
De resultaten omvatten alle staten met namen van twee woorden, zoals New Jersey, New York, North Carolina, South Dakota en West Virginia.
Oost bevatten. U kunt dit bevestigen door een andere zoekopdracht te doen: >> staat. name [grep ("East", state. name)] character (0) Wanneer het resultaat van een tekenbewerking een lege vector is (dat wil zeggen dat er niets in staat), staat R voor dit als teken (0). Evenzo wordt een lege of nul-lengte numerieke vector weergegeven met geheel getal (0) of numeriek (0).
R maakt een onderscheid tussen NULL en een lege vector. NULL betekent meestal dat iets ongedefinieerd is. Dit is subtiel anders dan iets dat leeg is. Een karaktervector die toevallig geen elementen bevat, is bijvoorbeeld nog steeds een tekenvector, weergegeven door teken (0).