Video: Thinking Tackle OD Season 2 Ep4: Danny Fairbrass & Team Korda | Korda Carp Fishing 2019 2024
Als je een gesmolten dataset hebt (een dataset in lang formaat), ben je klaar om het opnieuw te maken met R. Om te illustreren dat het proces van omvormen al uw gegevens intact houdt, probeer het origineel te reconstrueren: >> dcast (mgoals, Venue + Game ~ variabele, som) Game Venue Granny Geraldine Gertrude 1 1st Bruges 12 5 11 2 2nd Ghent 4 4 5 3 3rd Gent 5 2 6 4 4th Bruges 6 4 7
Kun je zien hoe dcast () een formule als zijn tweede argument neemt? Daarover meer in een minuut, maar inspecteer eerst uw resultaten. Het moet overeenkomen met het originele dataframe.
U gebruikt de functie dcast () om een gesmolten gegevensframe te casten. Voor alle duidelijkheid, u gebruikt dit om van een lang formaat naar een breed formaat te converteren, maar u kunt dit ook gebruiken om te aggregeren in tussenindelingen, vergelijkbaar met de manier waarop een draaitabel werkt.
De functie dcast () neemt drie argumenten:
-
: Een gesmolten gegevensframe. formule
-
: Een formule die aangeeft hoe u de gegevens wilt casten. Deze formule heeft de vorm x_variable ~ y_variable. Maar het is vereenvoudigd om een punt te maken. U kunt meerdere x -variabelen, meerdere y -variabelen en zelfs z -variabelen gebruiken. plezier. aggregaat
-
: Een functie die moet worden gebruikt als de gietformule resulteert in gegevensaggregatie (bijvoorbeeld length (), sum () of mean ()).
Als u wilt pak een tafel met de zaal langs de rijen en de speler aan de andere kant van de kolommen, je castingformule zou Venue ~ variable moeten zijn: >> dcast (mgoals, Venue ~ variable, sum) Locatie Granny Geraldine Gertrude 1 Brugge 18 9 18 2 Gent 9 6 11
Het is eigenlijk mogelijk om meer gecompliceerde castingformules te hebben. Volgens de Help-pagina voor dcast () heeft de formule het volgende formaat:
x_variable + x_2 ~ y_variable + y_2 ~ z_variable ~ …
Merk op dat u verschillende variabelen in elke dimensie kunt combineren met het plusteken (+) en u scheidt elke dimensie van een tilde (~). Als u twee of meer tildes in de formule hebt (dat wil zeggen dat u een
z
-variabele opneemt), is uw resultaat een multidimensionale array.
Om een overzicht van doelen te krijgen op locatie, speler (variabele) en spel, doet u het volgende: >> dcast (mgoals, Venue + variabele ~ Game, sum) Locatie variabele 1e 2e 3e 4e 1 Brugge Granny 12 0 0 6 2 Brugge Geraldine 5 0 0 4 3 Brugge Gertrude 11 0 0 7 4 Gent Granny 0 4 5 0 5 Gent Geraldine 0 4 2 0 6 Gent Gertrude 0 5 6 0 Een van de redenen waarom je zou moeten gegevens in lang formaat begrijpen, is dat zowel het rooster van de grafische pakketten als ggplot2 uitgebreid gebruikmaken van gegevens op lang formaat.Het voordeel is dat u eenvoudig plots van uw gegevens kunt maken die verschillende subgroepen met elkaar vergelijkt.