Huis Persoonlijke financiën Basisbeginselen van gegevenstypen en -structuren in R-programmeren voor voorspellende analyses - dummies

Basisbeginselen van gegevenstypen en -structuren in R-programmeren voor voorspellende analyses - dummies

Inhoudsopgave:

Video: Excel || Omzetten van tekst getallen naar getallen 2024

Video: Excel || Omzetten van tekst getallen naar getallen 2024
Anonim

In R-programmering voor voorspellende analyses worden gegevens -typen soms verward met gegevens -structuren . Elke variabele in het programmageheugen heeft een gegevenstype. Natuurlijk kun je wegkomen met verschillende variabelen in je programma en nog steeds beheersbaar zijn. Maar dat zal waarschijnlijk niet zo goed werken als je honderden (of duizenden) variabelen hebt; je moet elke variabele een naam geven zodat je er toegang toe hebt.

Het is efficiënter om al die variabelen op te slaan in een logische verzameling.

Datatypes

Net als andere volwaardige programmeertalen biedt R veel datatypen en datastructuren. Het is niet nodig om het type op te geven dat u toewijst aan een variabele; de tolk zal dat voor je doen. U kunt het type echter opgeven of omzetten als dat nodig is; dit wordt casting genoemd. Drie gegevenstypes zijn als volgt:

  • Numeriek: Dit zijn uw typische decimale getallen. Deze worden drijvers (afkorting van drijvende-kommawaarden ) of tweepersoonskamers in andere talen genoemd.

  • Personages: Dit zijn de reeksen die worden gevormd door combinaties van letters, tekens en cijfers. Het is niet de bedoeling dat ze een numerieke betekenis hebben. Deze worden strings in andere talen genoemd.

  • Logisch: TRUE of FALSE. Gebruik deze waarden altijd in R. Deze waarden worden Booleans genoemd in andere talen.

Als u een reeks getallen vergelijkt met een numeriek getal, resulteert de interpreter in het omzetten van de reeks getallen in een numeriek getal en vervolgens in een numerieke vergelijking.

Voorbeelden van gegevenstypen zijn als volgt: >> ijkm <- i == j # logisch> n <- i == k # logical

Nadat u die coderegels hebt uitgevoerd, kunt u hun waarden en typen met de functie str (). Die bewerking ziet er als volgt uit: >> str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> str (n) logi TRUE

The uitdrukking in de n-toewijzing is een voorbeeld van de interpreter die het gegevenstype van k tijdelijk omzet in een numeriek om de evaluatie uit te voeren tussen numeriek i en teken k.

Gegevensstructuren

R heeft een plaats nodig om groepen gegevenstypen op te slaan om daarmee efficiënt te kunnen werken. Dit worden

gegevensstructuren

genoemd. Een realistisch voorbeeld van dit concept is een parkeergarage: het is een structuur die auto's efficiënt opslaat. Het is ontworpen om zoveel mogelijk auto's te parkeren en zorgt ervoor dat auto's efficiënt de structuur kunnen betreden en verlaten.Ook mogen geen andere objecten naast auto's in een parkeerstructuur worden geparkeerd. Gegevensstructuren omvatten:

Vectoren:

Vectoren slaan een reeks waarden van een enkel gegevenstype op. Zie het als een wekelijkse pillendoos. Elk compartiment in de bunker kan alleen een bepaald type object opslaan. Nadat je wat pillen in een van de compartimenten hebt gestopt, moeten alle andere compartimenten ook worden gevuld met nul pillen of meer pillen.

  • Je kunt geen munten in dezelfde doos plaatsen; je moet daarvoor een ander "pillendoosje" (vector) gebruiken. Als u een getal in een vector opslaat, moeten alle toekomstige waarden ook cijfers zijn. Anders zet de interpreter al uw nummers om in tekens. Matrices:

    A

  • matrix ziet eruit als een Excel-werkblad: het is in wezen een tabel die bestaat uit rijen en kolommen. De gegevens vullen de lege cellen per rij- of kolomvolgorde, waarin u opgeeft wanneer u de matrix maakt. Alle kolommen moeten hetzelfde gegevenstype hebben. Gegevensframes:

    Een gegevensframe is vergelijkbaar met een matrix, behalve dat de kolommen van een gegevensframe verschillende gegevenstypen kunnen bevatten. De gegevensreeksen die worden gebruikt in voorspellende modellering worden geladen in gegevensframes en daar opgeslagen voor gebruik in het model.

  • Factoren: A

  • factor is als een vector met een beperkt aantal verschillende waarden. Het aantal verschillende waarden wordt het -niveau genoemd. U kunt factoren gebruiken om een ​​kolom met een beperkt en bekend aantal waarden als categorische waarden te behandelen. Standaard worden tekengegevens als factoren in dataframes geladen. U opent vectoren, matrices en gegevensframes met behulp van matrixnotatie

. U zou bijvoorbeeld v [5] typen om toegang te krijgen tot het vijfde element van vector v. Voor een tweedimensionale matrix en dataframe plaatst u het rijnummer en kolomnummer, gescheiden door een komma, tussen de vierkante haken. U typt bijvoorbeeld m [2, 3] om toegang te krijgen tot de tweede rij, derde kolomwaarde voor matrix m . Datastructuren zijn een geavanceerd onderwerp in de informatica. Voor nu houden we vast aan het praktische. Vergeet niet dat datastructuren zijn gebouwd om specifieke soorten gegevens op te slaan en ze hebben functies voor het invoegen, verwijderen en ophalen van gegevens.

Basisbeginselen van gegevenstypen en -structuren in R-programmeren voor voorspellende analyses - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...