Inhoudsopgave:
Video: Excel || Omzetten van tekst getallen naar getallen 2024
In R-programmering voor voorspellende analyses worden gegevens -typen soms verward met gegevens -structuren . Elke variabele in het programmageheugen heeft een gegevenstype. Natuurlijk kun je wegkomen met verschillende variabelen in je programma en nog steeds beheersbaar zijn. Maar dat zal waarschijnlijk niet zo goed werken als je honderden (of duizenden) variabelen hebt; je moet elke variabele een naam geven zodat je er toegang toe hebt.
Het is efficiënter om al die variabelen op te slaan in een logische verzameling.
Datatypes
Net als andere volwaardige programmeertalen biedt R veel datatypen en datastructuren. Het is niet nodig om het type op te geven dat u toewijst aan een variabele; de tolk zal dat voor je doen. U kunt het type echter opgeven of omzetten als dat nodig is; dit wordt casting genoemd. Drie gegevenstypes zijn als volgt:
-
Numeriek: Dit zijn uw typische decimale getallen. Deze worden drijvers (afkorting van drijvende-kommawaarden ) of tweepersoonskamers in andere talen genoemd.
-
Personages: Dit zijn de reeksen die worden gevormd door combinaties van letters, tekens en cijfers. Het is niet de bedoeling dat ze een numerieke betekenis hebben. Deze worden strings in andere talen genoemd.
-
Logisch: TRUE of FALSE. Gebruik deze waarden altijd in R. Deze waarden worden Booleans genoemd in andere talen.
Als u een reeks getallen vergelijkt met een numeriek getal, resulteert de interpreter in het omzetten van de reeks getallen in een numeriek getal en vervolgens in een numerieke vergelijking.
Voorbeelden van gegevenstypen zijn als volgt: >> ijkm <- i == j # logisch> n <- i == k # logical
Nadat u die coderegels hebt uitgevoerd, kunt u hun waarden en typen met de functie str (). Die bewerking ziet er als volgt uit: >> str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> str (n) logi TRUE
The uitdrukking in de n-toewijzing is een voorbeeld van de interpreter die het gegevenstype van k tijdelijk omzet in een numeriek om de evaluatie uit te voeren tussen numeriek i en teken k.
Gegevensstructuren
R heeft een plaats nodig om groepen gegevenstypen op te slaan om daarmee efficiënt te kunnen werken. Dit worden
gegevensstructuren
genoemd. Een realistisch voorbeeld van dit concept is een parkeergarage: het is een structuur die auto's efficiënt opslaat. Het is ontworpen om zoveel mogelijk auto's te parkeren en zorgt ervoor dat auto's efficiënt de structuur kunnen betreden en verlaten.Ook mogen geen andere objecten naast auto's in een parkeerstructuur worden geparkeerd. Gegevensstructuren omvatten:
Vectoren:
Vectoren slaan een reeks waarden van een enkel gegevenstype op. Zie het als een wekelijkse pillendoos. Elk compartiment in de bunker kan alleen een bepaald type object opslaan. Nadat je wat pillen in een van de compartimenten hebt gestopt, moeten alle andere compartimenten ook worden gevuld met nul pillen of meer pillen.
-
Je kunt geen munten in dezelfde doos plaatsen; je moet daarvoor een ander "pillendoosje" (vector) gebruiken. Als u een getal in een vector opslaat, moeten alle toekomstige waarden ook cijfers zijn. Anders zet de interpreter al uw nummers om in tekens. Matrices:
A
-
matrix ziet eruit als een Excel-werkblad: het is in wezen een tabel die bestaat uit rijen en kolommen. De gegevens vullen de lege cellen per rij- of kolomvolgorde, waarin u opgeeft wanneer u de matrix maakt. Alle kolommen moeten hetzelfde gegevenstype hebben. Gegevensframes:
Een gegevensframe is vergelijkbaar met een matrix, behalve dat de kolommen van een gegevensframe verschillende gegevenstypen kunnen bevatten. De gegevensreeksen die worden gebruikt in voorspellende modellering worden geladen in gegevensframes en daar opgeslagen voor gebruik in het model.
-
Factoren: A
-
factor is als een vector met een beperkt aantal verschillende waarden. Het aantal verschillende waarden wordt het -niveau genoemd. U kunt factoren gebruiken om een kolom met een beperkt en bekend aantal waarden als categorische waarden te behandelen. Standaard worden tekengegevens als factoren in dataframes geladen. U opent vectoren, matrices en gegevensframes met behulp van matrixnotatie
. U zou bijvoorbeeld v [5] typen om toegang te krijgen tot het vijfde element van vector v. Voor een tweedimensionale matrix en dataframe plaatst u het rijnummer en kolomnummer, gescheiden door een komma, tussen de vierkante haken. U typt bijvoorbeeld m [2, 3] om toegang te krijgen tot de tweede rij, derde kolomwaarde voor matrix m . Datastructuren zijn een geavanceerd onderwerp in de informatica. Voor nu houden we vast aan het praktische. Vergeet niet dat datastructuren zijn gebouwd om specifieke soorten gegevens op te slaan en ze hebben functies voor het invoegen, verwijderen en ophalen van gegevens.