Video: Data Analysis in R by Dustin Tran 2024
Kansverdelingen is een van de vele statistische technieken die kunnen worden gebruikt om gegevens te analyseren om bruikbare patronen te vinden. U gebruikt een kansverdeling om de kansen te berekenen die aan de elementen van een gegevensreeks zijn gekoppeld:
-
Binomiale verdeling: U zou de binomiale verdeling gebruiken om variabelen te analyseren die slechts één van de twee waarden kunnen aannemen. U kunt bijvoorbeeld de kans bepalen dat een bepaald percentage leden van een sportvereniging linkshandig is.
-
Poissonverdeling: U zou de Poisson-verdeling gebruiken om de waarschijnlijkheid te beschrijven van een bepaald aantal gebeurtenissen die zich in een bepaald tijdsinterval voordoen. Het kan bijvoorbeeld worden gebruikt om de kans op een bepaald aantal hits op een website het komende uur te beschrijven.
-
Normale verdeling: De normale verdeling is de meest gebruikte kansverdeling in de meeste disciplines, waaronder economie, financiën, marketing, biologie, psychologie en vele andere. Een van de karakteristieke kenmerken van de normale verdeling is symmetrie - de waarschijnlijkheid dat een variabele een bepaalde afstand onder het gemiddelde van de verdeling is, komt overeen met de waarschijnlijkheid dat het eenzelfde afstand boven het gemiddelde is.
Bijvoorbeeld, als de gemiddelde lengte van alle mannen in de Verenigde Staten 70 inch is en hoogten normaal verdeeld zijn, is een willekeurig gekozen man even waarschijnlijk tussen 68 en 70 inches lang als hij moet tussen de 70 en 72 centimeter lang zijn.
De normale verdeling werkt goed met veel toepassingen. Het wordt bijvoorbeeld vaak gebruikt op het gebied van financiën om het rendement op financiële activa te beschrijven. Vanwege het gemak van interpretatie en implementatie, wordt de normale verdeling soms gebruikt, zelfs als de aanname van normaliteit slechts bij benadering correct is.
-
De Student-t-verdeling: De Student-t-verdeling lijkt op de normale verdeling, maar met de Student-t-verdeling zullen extreem kleine of extreem grote waarden veel vaker voorkomen. Deze verdeling wordt vaak gebruikt in situaties waarin een variabele te veel variatie vertoont om consistent te zijn met de normale verdeling. Dit is het geval wanneer de eigenschappen van kleine monsters worden geanalyseerd. Bij kleine monsters is de variatie tussen de monsters waarschijnlijk behoorlijk groot, dus de normale verdeling mag niet worden gebruikt om hun eigenschappen te beschrijven.
De Student-t-verdeling is ontwikkeld door W.S. Gosset in dienst bij het Guinness-brouwerijbedrijf. Hij probeerde de eigenschappen van kleine steekproefgemiddelden te beschrijven.
-
De chikwadraatverdeling: De chikwadraatverdeling is geschikt voor verschillende soorten toepassingen. U kunt het bijvoorbeeld gebruiken om te bepalen of een populatie een bepaalde kansverdeling volgt. U kunt het ook gebruiken om te testen of de variantie van een populatie gelijk is aan een opgegeven waarde en om te testen op de onafhankelijkheid van twee datasets.
-
De F-verdeling: De F-verdeling is afgeleid van de chikwadraatverdeling. Je gebruikt het om te testen of de varianties van twee populaties gelijk zijn aan elkaar. De F-verdeling is ook nuttig in toepassingen zoals regressieanalyse.