Video: Archiveren kun je leren! 2024
Ondanks het feit dat CSV-bestanden (comma-separated values) op grote schaal worden gebruikt om gegevens in R te importeren en exporteren, zijn ze niet altijd het meest geschikte formaat. Sommige gegevensformaten maken de specificatie mogelijk van gegevens die niet van een tabel zijn. Andere gegevensindelingen maken de beschrijving van de gegevens mogelijk met metagegevens (gegevens die gegevens beschrijven).
De basisdistributie van R bevat een pakket met de naam foreign dat functies bevat voor het importeren van gegevensbestanden uit een aantal commerciële statistische pakketten, waaronder SPSS, Stata, SAS, Octave en Minitab.
Om deze functies te gebruiken, moet u eerst het buitenlandse pakket laden: >> bibliotheek (buitenland)> lezen. spss (bestand = "location / of / myfile")
Systeem
Functie om te importeren naar R | SPSS |
---|---|
lezen. spss | SAS |
lees. xport of lezen. ssd | Stata |
lees. dta | Minitab |
lees. mtp | Lees de Help-documentatie over deze functies zorgvuldig door. Omdat gegevensframes in R een heel andere structuur kunnen hebben dan gegevenssets in de statistische pakketten, moet u speciale aandacht besteden aan hoe waarden en variabele labels door deze functies worden behandeld. Controleer ook de behandeling van speciale ontbrekende waarden. |
Merk op dat sommige van deze functies vrij oud zijn. De nieuwste versies van de statistische pakketten die hier worden genoemd, kunnen verschillende specificaties hebben voor het formaat, dus de functies werken niet altijd gegarandeerd.
Waar het om gaat: als u gegevens kunt overzetten met behulp van CSV-bestanden, bespaart u uzelf veel problemen.
Tot slot, als u R nodig hebt om R met een database te verbinden, bestaat de kans dat er een pakket bestaat dat verbinding kan maken met uw gewenste database. Zie de sidebar in de buurt, "Werken met databases in R," voor enkele aanwijzers.