Inhoudsopgave:
- Snijden gebruiken om een vast aantal subgroepen te maken
-
te illustreren, maakt de functie cut () in R bins van gelijke grootte (standaard) in uw gegevens en classificeert vervolgens elk element in zijn juiste bak.
Maak je geen zorgen als dit een mondvol klinkt. Een paar voorbeelden zouden dit tot leven moeten brengen.
Snijden gebruiken om een vast aantal subgroepen te maken
Om het gebruik van cut () te illustreren, bekijkt u de ingebouwde datasetstatus. x77, een array met verschillende kolommen en één rij voor elke staat in de Verenigde Staten:
U wilt werken met de kolom Frost. Probeer het volgende om deze kolom uit te pakken:
Het resultaat is een factor met drie niveaus. De namen van de niveaus lijken een beetje ingewikkeld, maar zij vertellen u in wiskundige vaste notatie wat de grenzen van uw bakken zijn. De eerste bak bevat bijvoorbeeld die statussen met vorst tussen -0. 188 en 62. 8 dagen.
In werkelijkheid zal natuurlijk geen van de staten vorst hebben op negatieve dagen - R is wiskundig conservatief en voegt een beetje opvulling toe.
Labels toevoegen om te snijden
Het niveau namen zijn niet erg gebruiksvriendelijk, dus geef een aantal betere namen op met de l abels argument: >> cut (frost, 3, include. laagste = TRUE, labels = c ("Laag", "Med", "Hoog")) [1] Laag Hoog Laag Med Laag Hoog Hoog Med Laag Laag Laag … [45] Hoog Half Laag Hoog Hoog Hoog Niveaus: Laag Half HoogNu heb je een factor die staten indeelt in laag, gemiddeld en hoog, afhankelijk van het aantal dagen vorst dat ze krijgen.