Video: Regressie-analyse in Excel analysis toolpak 2024
Als u gebruikers van R vraagt wat de beste manier is om gegevens rechtstreeks vanuit Microsoft Excel te importeren, zijn de meeste zal waarschijnlijk antwoorden dat uw beste optie is om eerst vanuit Excel naar een CSV-bestand te exporteren en vervolgens met lezen te gebruiken. csv () om uw gegevens te importeren in R.
In feite is dit nog steeds het advies in hoofdstuk 8 van de R-import- en exporthandleiding, waarin staat: "Het eerste advies is om dit te voorkomen als dat mogelijk is! "De reden is dat veel van de bestaande methoden voor het importeren van gegevens uit Excel afhankelijk zijn van software of bibliotheken van derden die mogelijk moeilijk te configureren zijn, niet beschikbaar zijn op alle besturingssystemen of misschien beperkende licentievoorwaarden bevatten.
Sinds februari 2011 bestaat er echter een nieuw alternatief: gebruik van het pakket XLConnect, verkrijgbaar bij CRAN. Wat XLConnect anders maakt, is dat het een Java-bibliotheek gebruikt om Excel-bestanden te lezen en te schrijven. Dit heeft twee voordelen:
-
Het werkt op alle besturingssystemen die Java ondersteunen. XLConnect is geschreven in Java en draait op Windows, Linux en Mac OS.
-
Er kan niets anders worden geladen. XLConnect vereist geen andere bibliotheken of software. Als u Java hebt geïnstalleerd, zou het moeten werken.
XLConnect kan ook Excel-bestanden schrijven, inclusief het wijzigen van de celopmaak, in zowel de indelingen Excel 97-2003 en Excel 2007/10.
Voor meer informatie over XLConnect kunt u het uitstekende pakketvignet lezen.
Je bent nu waarschijnlijk aan het kriebelen om aan de slag te gaan met een voorbeeld. Stel dat u een Excel-spreadsheet in uw gebruikersdirectory Elements wilt lezen. xlsx. Installeer en laad eerst het pakket; maak vervolgens een object met de bestandsnaam:
Nu bent u klaar om een werkblad van deze werkmap te lezen met de functie readWorksheetFromFile (). U moet het ten minste twee argumenten doorgeven:
bestand
-
: Een tekenreeks met een pad naar een geldig. xls of. xlsx-bestand blad
-
: een geheel getal dat de positie van het werkblad aangeeft (bijvoorbeeld blad = 1) of de naam van het werkblad (bijvoorbeeld blad = "Blad2") volgende twee regels doen precies hetzelfde: ze importeren beide de gegevens in het eerste werkblad (genaamd Blad1): >> elementen elementen <- readWorksheetFromFile (excel. file, sheet = "Sheet1")