Video: Importing Data from Excel into SPSS/PASW 2024
Een van de eenvoudigste en betrouwbaarste manieren om gegevens in R te krijgen, zijn door tekstbestanden te gebruiken, met name CSV-bestanden (door komma's gescheiden waarden). De CSV-bestandsindeling maakt gebruik van komma's om de verschillende elementen in een regel te scheiden en elke gegevenslijn staat op een eigen regel in het tekstbestand, waardoor CSV-bestanden ideaal zijn voor het weergeven van tabelgegevens.
Het extra voordeel van CSV-bestanden is dat vrijwel elke gegevenstoepassing het exporteren van gegevens naar het CSV-formaat ondersteunt. Dit is zeker het geval voor de meeste spreadsheet-applicaties, inclusief Microsoft Excel en OpenOffice Calc.
Ga in de volgende voorbeelden ervan uit dat u een CSV-bestand hebt opgeslagen in een handige map in uw bestandssysteem. Als u een Excel-spreadsheet naar CSV-indeling wilt converteren, moet u Bestand → Opslaan als kiezen, waarmee u uw bestand in verschillende indelingen kunt opslaan.
Houd er rekening mee dat een CSV-bestand slechts één werkblad van een spreadsheet kan zijn. Gebruik ten slotte de bovenste rij van uw werkblad (rij 1) voor de kolomkoppen.
In R gebruik je de read. csv () functie om gegevens in CSV-indeling te importeren. Deze functie heeft een aantal argumenten, maar het enige essentiële argument is bestand, dat de locatie en bestandsnaam opgeeft. Om een bestand met de naam elementen te lezen. csv op f: gebruik read. csv () met bestand. pad: >> elementen str (elementen) 'gegevens. frame ': 10 obs. van 9 variabelen: $ Atomic. nummer: int 1 2 3 4 5 6 7 8 9 10 $ Naam: factor met 10 niveaus "Beryllium", "Boron", …: 6 5 7 1 2 3 9 10 4 8 $ Symbool: factor met 10 niveaus " B "," Be "," C "," F ", …: 5 6 7 2 1 3 8 10 4 9 $ Groep: int 1 18 1 2 13 14 15 16 17 18 $ Periode: int 1 1 2 2 2 2 2 2 2 2 $ Blok: Factor met 2 niveaus "p", "s": 2 2 2 2 1 1 1 1 1 $ Status. op. STP: Factor met 2 niveaus "Gas", "Stabiel": 1 1 2 2 2 2 1 1 1 1 $ Voorkomen: Factor met 1 niveau "Primordiaal": 1 1 1 1 1 1 1 1 1 $ Beschrijving: Factor met 6 niveaus "Alkalimetaal", …: 6 5 1 2 4 6 6 6 3 5
R importeert de gegevens in een gegevensframe. Zoals u kunt zien, heeft dit voorbeeld tien waarnemingen van negen variabelen.
Deze standaardoptie voor het converteren van tekenreeksen in factoren wanneer u lezen gebruikt. tabel () kan een bron van grote verwarring zijn. Het is vaak beter om gegevens die strings bevatten zodanig te importeren dat de tekenreeksen geen geconverteerde factoren zijn, maar karaktervectoren blijven.Als u gegevens wilt importeren die reeksen bevatten, gebruikt u de argumentenstringAsFactors = FALSE om te lezen. csv () of lezen. table ():