Video: Difference between Core java and Advanced java 2024
Op het gebied van statistiek, om onderscheid te kunnen maken tussen variabelen van verschillende typen is erg belangrijk. Het type gegevens bepaalt vaak het type analyse dat kan worden uitgevoerd. Als gevolg hiervan biedt R de mogelijkheid om gegevens expliciet als volgt te classificeren:
-
Nominale gegevens: Dit type gegevens, dat u vertegenwoordigt in R met factoren, maakt onderscheid tussen verschillende categorieën, maar er is geen impliciete volgorde tussen categorieën. Voorbeelden van nominale gegevens zijn kleuren (rood, groen, blauw), geslacht (mannelijk, vrouwelijk) en nationaliteit (Brits, Frans, Japans).
-
Oorspronkelijke gegevens: Ordinale gegevens worden onderscheiden door het feit dat er een soort van natuurlijke volgorde tussen elementen is maar geen indicatie van het relatieve grootteverschil. Alle soorten gegevens die kunnen worden gerangschikt in volgorde maar waaraan geen exacte waarden worden gegeven, zijn ordinaal. low << medium << high beschrijft bijvoorbeeld gegevens die zijn geordend op drie niveaus. In marktonderzoek is het heel gebruikelijk om een vijfpuntsschaal te gebruiken om percepties te meten: helemaal mee oneens
roodDit is ook een voorbeeld van ordinale gegevens.
om de projectstatus aan te geven. In R gebruikt u geordende factoren om ordinale gegevens te beschrijven. Numerieke gegevens: U hebt numerieke gegevens wanneer u uw gegevens met getallen kunt beschrijven (bijvoorbeeld lengte, gewicht of aantal). Numerieke gegevens hebben twee subcategorieën.
-
Geschaalde intervalgegevens: U hebt intervalgeschaalde gegevens wanneer het interval tussen aangrenzende meeteenheden hetzelfde is, maar het nulpunt is willekeurig. Een dagelijks voorbeeld van gegevens met intervalschaal is ons kalendersysteem. Elk jaar heeft dezelfde lengte, maar het nulpunt is willekeurig. Met andere woorden, de tijd startte niet in het jaar nul - gebruik eenvoudig een gemakkelijk jaar om te beginnen met tellen. Dit betekent dat u datums (en alle andere soorten intervalgeschaalde gegevens) kunt toevoegen en aftrekken, maar u kunt datums niet op zinvolle wijze verdelen. Andere voorbeelden zijn lengtegraad en al het andere waar er onenigheid kan bestaan over waar het startpunt ligt.
-
integer
of numerieke -objecten gebruiken om intervalgeschaalde gegevens weer te geven. Verhouding geschaalde gegevens: Dit zijn gegevens waar allerlei wiskundige bewerkingen zijn toegestaan, met name het vermogen om te vermenigvuldigen en te delen (met andere woorden, verhoudingen).De meeste gegevens in natuurwetenschappen worden in verhouding geschaald - bijvoorbeeld lengte, massa en snelheid. In R gebruikt u
-
numerieke -objecten om gegevens met een verhouding van schaal te vertegenwoordigen.
-