Video: Data Analysis in R by Dustin Tran 2024
boxplot is ontworpen om verschillende belangrijke statistieken voor een gegevensset in de vorm van een verticale rechthoek of kader te tonen. De statistieken die kunnen worden weergegeven, zijn onder meer: Minimumwaarde
-
Maximale waarde
-
Eerste kwartiel (Q
-
1 ) Tweede kwartiel (Q
-
2 ) < Derde kwartiel (Q 3
-
) Interkwartielbereik (IQR)
-
Het
eerste kwartiel
van een gegevensset is een numerieke meetwaarde die de gegevens in twee delen verdeelt: de kleinste 25 procent van de waarnemingen en de grootste 75 procent van de waarnemingen. Met andere woorden, het eerste kwartiel is een numerieke waarde met de volgende eigenschappen: 25 procent van de waarnemingen in de gegevensset zijn kleiner dan
-
het eerste kwartiel. 75 procent van de waarnemingen in de gegevensset is groter dan
-
het eerste kwartiel.
(ook bekend als de mediaan ) de gegevens doormidden, dus 50 procent van de elementen is kleiner dan de mediaan en 50 procent is groter. Het derde kwartiel
is de waarde waarvoor het volgende geldt: 75 procent van de waarnemingen in de gegevensset is kleiner dan
-
het derde kwartiel. 25 procent van de waarnemingen in de dataset is groter dan
-
het derde kwartiel.
is het verschil tussen het derde kwartiel en het eerste kwartiel: IQR = Q 3 - Q 1 >. Het interkwartielbereik is een spreidingsmaat; het laat zien hoeveel ruimte er is tussen de elementen in de middelste 50 procent van een dataset. Er wordt een boxplot getekend, zodat
De bovenkant van de doos vertegenwoordigt het derde kwartiel (Q
3
-
) van de gegevens. De onderkant van het vak vertegenwoordigt het eerste kwartiel (Q 1
-
) van de gegevens. Het midden van de doos (weergegeven met een lijn) staat voor het tweede kwartiel (Q 2
-
). Daarnaast is er een regel boven die de waarde van de maximum
aangeeft in de gegevens die niet hoger zijn dan Q 3 + 1. 5 x IQR en een regel onder het vak om de minimum -waarde aan te geven in de gegevens die niet lager zijn dan Q 1 - 1. 5 x IQR. Waarden buiten dit bereik zijn uitschieters en worden op de boxplot weergegeven als afzonderlijke punten. Deze afbeelding toont een boxplot van de dagprijzen van Microsoft-aandelen van 1 januari 2013 tot 31 december 2013. Boxplot van dagprijzen voor Microsoft-aandelen. Er zijn geen uitbijters in deze gegevens.Daarom laat de bottom line in de boxplot zien dat de laagste prijs in deze periode iets minder was dan $ 26. 00, en de bovenste regel laat zien dat de hoogste prijs iets meer dan $ 38 was. De onderkant van het vak komt overeen met het eerste kwartiel, wat $ 27 is. 43; de ononderbroken lijn in het midden van de doos komt overeen met het tweede kwartiel (mediaan), wat $ 31 is. 89. De bovenkant van de doos komt overeen met het derde kwartiel, wat $ 33 is. 78. De hoogte van de box is gelijk aan het interkwartielbereik (IQR), wat $ 6 is. 35. Als een ander voorbeeld toont deze figuur een boxplot van de dagprijzen van Apple-aandelen van 1 januari 2013 tot 31 december 2013.
Boxplot van dagprijzen voor Apple-voorraad vanaf 1 januari 2013 tot 31 december 2013.
De laagste prijs in 2013 voor Apple aandelen was $ 53. 84, en de hoogste prijs was $ 80. 11. Er zijn geen uitschieters in de gegevens, dus deze waarden worden weergegeven door respectievelijk de onderste regel en de bovenste regel.Het eerste kwartiel, dat onder aan het vak staat, was $ 60. 48. Het tweede kwartiel was $ 63. 65 (weergegeven door de effen zwarte lijn) en het derde kwartiel was $ 70. 32, weergegeven aan de bovenkant van de doos. Als gevolg hiervan is het interkwartielbereik (IQR) $ 9. 84.