Video: Grafieken invoegen en bewerken in Excel 2025
Om erachter te komen welke gegevens kunnen worden meegewogen bij het werken in R, laten we de dataset mtcars eens bekijken. Deze ingebouwde dataset beschrijft het brandstofverbruik en tien verschillende ontwerppunten van 32 auto's uit de jaren 70. Het bevat in totaal 11 variabelen, maar ze zijn allemaal numeriek.
Hoewel u met het dataframe kunt werken zoals het is, kunnen sommige variabelen worden geconverteerd naar een factor omdat ze een beperkte hoeveelheid waarden hebben.
Als u niet weet hoeveel verschillende waarden een variabele heeft, kunt u deze informatie in twee eenvoudige stappen krijgen:
-
Krijg de unieke waarden van de variabele met unique () .
-
Bereken de lengte van de resulterende vector met length () .
Met de functie sapply () kunt u dit voor het hele gegevensframe tegelijk doen. U past een anonieme functie toe door beide genoemde stappen in het hele dataframe te combineren, zoals deze:
U hebt 32 verschillende waarnemingen in die gegevensreeks, dus geen van de variabelen heeft alleen unieke waarden.
Wanneer een variabele als een factor moet worden behandeld, hangt een beetje af van de situatie, maar vermijd in het algemeen meer dan tien verschillende niveaus in een factor en probeer ten minste vijf waarden per niveau te hebben.
