Inhoudsopgave:
- Gegevenswaarden ophalen
- U weet nu dat - volgens uw model - een auto met een gewicht van 2. 4 ton heeft,
Video: T-statistic confidence interval | Inferential statistics | Probability and Statistics | Khan Academy 2024
Naast het beschrijven van relaties, kunnen modellen ook worden gebruikt om waarden voor nieuwe gegevens te voorspellen. Daarvoor gebruiken veel modelsystemen in R dezelfde functie, gewoonlijk voorspelling () genoemd. Elk modelleringsparadigma in R heeft een voorspellingsfunctie met een eigen smaak, maar over het algemeen is de basisfunctionaliteit voor al deze hetzelfde.
Gegevenswaarden ophalen
Een autofabrikant heeft bijvoorbeeld drie ontwerpen voor een nieuwe auto en wil weten wat de voorspelde kilometerstand is op basis van het gewicht van elk nieuw ontwerp. Om dit te doen, maakt u eerst een dataframe met de nieuwe waarden, bijvoorbeeld:
Zorg er altijd voor dat de variabelenamen die u gebruikt dezelfde zijn als die in het model worden gebruikt. Wanneer je dat doet, roep je gewoon de functie voorspellen () aan met de geschikte argumenten, zoals deze: >> voorspellen (Model, nieuwe gegevens = nieuwe.auto's) 1 2 3 28. 19952 24. 45839 18. 04503
Dus, de lichtste auto heeft een voorspelde kilometerstand van 28. 2 mijl per gallon en de zwaarste auto heeft een voorspelde kilometerstand van 18 mijl per gallon, volgens dit model. Natuurlijk, als u een ontoereikend model gebruikt, kunnen uw voorspellingen ook behoorlijk afwijken.
Vertrouwen in uw voorspellingen
Om een idee te hebben over de juistheid van de voorspellingen, kunt u vragen naar intervallen rond uw voorspelling. Om een matrix met de voorspelling en een betrouwbaarheidsinterval van 95 procent rond de gemiddelde voorspelling te krijgen, stelt u het argumentinterval in op 'vertrouwen' als volgt: >> voorspellen (Model, newdata = new. Cars, interval = "confidence") fit lwr upr 1 28. 19952 26. 14755 30. 25150 2 24. 45839 23. 01617 25. 90062 3 18. 04503 16. 86172 19. 22834U weet nu dat - volgens uw model - een auto met een gewicht van 2. 4 ton heeft,
gemiddeld
,
een kilometerstand tussen 23 en 25. 9 mijl per gallon. Op dezelfde manier kunt u een voorspellingsinterval van 95 procent vragen door het argumentinterval in te stellen op 'voorspelling':