Video: Glazen bol fotografie - Glazen bol kopen? (starterskit verkoop) - Tips en trucs 2024
Een histogram is een grafiek die de waarschijnlijkheidsverdeling van een gegevensset weergeeft. Een histogram heeft een reeks verticale staven waarbij elke staaf een enkele waarde of een bereik van waarden voor een variabele vertegenwoordigt. De hoogte van de balken geeft de frequenties of kansen voor de verschillende waarden of bereiken van waarden aan.
Deze figuur toont bijvoorbeeld een histogram van de dagprijzen van Apple-aandelen van 1 januari 2013 tot 31 december 2013.
Volgens dit histogram lagen de meeste prijzen tussen $ 60 en $ 65; de prijs was in dit bereik 81 keer gedurende het jaar. De op een na meest waargenomen prijzen waren tussen $ 55 en $ 60; de prijs landde in dit bereik 44 keer gedurende het jaar. Het op twee na meest frequente prijsbereik lag tussen $ 65 en $ 70, en het vierde meest frequente bereik van prijzen lag tussen $ 70 en $ 75. Er waren maar heel weinig prijzen tussen $ 50 en $ 55, en de minste prijzen die gedurende het jaar werden waargenomen, lagen tussen $ 80 en $ 85.
Op basis van de grafiek lagen de gemiddelde en mediaanprijs dichtbij het bereik van $ 60 tot $ 65. Het werkelijke gemiddelde was $ 65. 67 en de werkelijke mediaan was $ 63. 65. Aangezien het gemiddelde de mediaan overschrijdt, was de prijsverdeling voor 2013 positief scheefgetrokken. Dit geeft aan dat de kans op een extreem hoge prijs iets groter is dan de waarschijnlijkheid van een extreem lage prijs.
Een verdeling is positief scheef als het gemiddelde groter is dan de mediaan; het is negatief scheef als het gemiddelde kleiner is dan de mediaan. De verdeling is symmetrisch over het gemiddelde als het gemiddelde gelijk is aan de mediaan. Hoeveel de gegevens scheef zijn, hangt af van hoe ver het gemiddelde en de mediaan verschillen. Als ze heel dichtbij zijn, is het soms praktisch om de distributie als symmetrisch te behandelen.
Als een ander voorbeeld toont deze figuur een histogram van de dagprijzen van de S & P 500 aandelenindex van 1 januari 2013 tot 31 december 2013.
Histogram van dagprijzen voor de S & P 500.Volgens het histogram in figuur 12-10 was het meest waargenomen prijsbereik gedurende het jaar tussen $ 1, 650 en $ 1, 700. Het gemiddelde bleek $ 1, 643. 80 te zijn, en de mediaan was $ 1, 650. 41. In tegenstelling tot de aandelen van Apple was het gemiddelde lager dan de mediaan; de prijsverdeling voor 2013 is negatief scheef. Dit geeft aan dat de Standard and Poor's 500 een iets grotere tendens vertoonde om onder het gemiddelde te handelen dan boven het gemiddelde in 2013.
Een van de belangrijkste vormen van gebruik van histogrammen is om te bepalen of een dataset een gespecificeerde waarschijnlijkheidsverdeling.Hoewel er veel formele statistische tests zijn om te bepalen welke kansverdeling een gegevensset volgt, is het een goede gewoonte om de gegevens visueel te inspecteren met een grafiek voordat u formele statistische tests uitvoert.
Het histogram van de Apple-prijzen geeft sterk bewijs dat de aandelenkoersen van Apple niet normaal verdeeld zijn. De normale verdeling is symmetrisch over het gemiddelde, terwijl de aandelenkoersen van Apple positief zijn scheefgetrokken. Het histogram van de S & P-prijzen geeft sterk bewijs dat het onwaarschijnlijk is dat de S & P 500 normaal wordt gedistribueerd omdat de verdeling negatief is scheefgetrokken.
Formele statistische tests zouden vereist zijn om aan te tonen dat geen van de verdeling normaal is, maar de grafieken zijn zeer suggestief. Omdat veel statistische tests gebaseerd zijn op de aanname van normaliteit, is het belangrijk om te bepalen of een distributie echt normaal is voordat u een van deze tests gebruikt.