Video: DEWA 3-asser in hondengang tijdens openen perceel 2024
Anders dan een stam-en-bladenplot, is een spreidingsplot bedoeld om de relatie tussen twee variabelen te tonen. Het kan moeilijk zijn om te zien of er een relatie is tussen twee variabelen door gewoon naar de onbewerkte gegevens te kijken, maar met een spreidingsdiagram worden alle patronen die in de gegevens bestaan, veel gemakkelijker te zien.
Een scatterplot bestaat uit een reeks punten; elk punt toont een enkele waarde voor twee verschillende variabelen. U kunt bijvoorbeeld een scatterplot maken om de relatie weer te geven tussen de jaarlijkse omzet van een bedrijf en zijn jaarlijkse winst. Als u winst wilt voorspellen op basis van de opbrengst, wordt de X-as gebruikt om de jaarlijkse inkomsten weer te geven en de Y-as wordt gebruikt om de jaarlijkse winst weer te geven. Dus inkomsten worden beschouwd als de onafhankelijke variabele en winst wordt beschouwd als de afhankelijke variabele in deze relatie.
Op een scatterplot, wordt de X-as (dat wil zeggen de horizontale as) gebruikt om de onafhankelijke variabele en de Y-as (de verticale as) weer te geven wordt gebruikt om de afhankelijke -variabele te tonen.
In dit voorbeeld geeft elk punt van de scatterplot de inkomsten en verkopen voor een bepaald jaar weer. De tabel toont de relatie tussen de jaaromzet en jaarwinst van een onderneming in de jaren 2004-2014.
Jaar | Opbrengsten ($ miljoen) | Winst ($ miljoenen) |
---|---|---|
2004 | 225 | 42 > 2005 |
237 | 43 | 2006 |
245 | 48 | 2007 |
222 | 40 | 2008 |
265 | 60 | 2009 |
270 | 56 | 2010 |
254 | 53 | 2011 |
280 | 60 | 2012 |
290 | 62 | 2013 > 305 |
65 | 2014 | 312 |
71 |
|
De volgende afbeelding toont de resulterende spreidingsplot. |
Elk punt op de scatterplot vertegenwoordigt de inkomsten en gerelateerde winsten van de onderneming voor één jaar. Het punt in de rechterbovenhoek van de plot vertegenwoordigt bijvoorbeeld gegevens voor 2014, toen de inkomsten van het bedrijf $ 312 miljoen bedroegen en de winst $ 71 miljoen was.
U kunt een scatterplot gebruiken om te bepalen ofde twee variabelen de neiging hebben om in dezelfde richting te bewegen.
De twee variabelen hebben de neiging om in tegengestelde richtingen te bewegen.
-
De twee variabelen zijn niet gerelateerd aan elkaar.
-
Als twee variabelen de neiging hebben om in dezelfde richting te bewegen, wordt gezegd dat ze
-
positief gecorreleerd zijn;
als ze de neiging hebben om in tegengestelde richtingen te bewegen, wordt gezegd dat ze negatief gecorreleerd zijn.Als twee variabelen geen specifiek patroon vertonen, is er gezegd dat ze niet-gecorreleerd zijn. Deze figuur toont een scatterplot voor twee variabelen (X en Y) die positief gecorreleerd zijn. Scatterplot van twee positief gecorreleerde variabelen.
De spreidingsplot laat zien dat wanneer X toeneemt, er een sterke neiging is voor Y om te verhogen (maar niet noodzakelijkerwijs met dezelfde hoeveelheid). Dit toont aan dat X en Y positief gecorreleerd zijn.
De volgende afbeelding toont dezelfde scatterplot met eentrendlijn;
de vergelijking van deze regel wordt geschat met regressieanalyse. Scatterplot van twee positief gecorreleerde variabelen met een trendlijn. De trendlijn geeft aan hoeveel Y gemiddeld verandert, gegeven een specifieke verandering in X. Een positief aflopende trendlijn geeft aan dat twee variabelen positief gecorreleerd zijn; evenzo geeft een negatief aflopende trendlijn aan dat twee variabelen negatief gecorreleerd zijn. Als een trendlijn vlak is (dat wil zeggen, heeft een helling nul), geeft dit aan dat de twee variabelen geen verband met elkaar hebben. De positief aflopende trendlijn laat zien dat X en Y positief gecorreleerd zijn.
De volgende afbeelding toont een spreidingsplot en de trendlijn voor twee variabelen dienegatief
gecorreleerd zijn. Scatterplot van twee negatief gecorreleerde variabelen met een trendlijn. De scatterplot geeft aan dat als X toeneemt, Y de neiging heeft af te nemen; de trendlijn heeft een
negatievehelling. Daarom zijn X en Y negatief gecorreleerd. De volgende afbeelding toont een spreidingsdiagram en de trendlijn voor twee variabelen die niet-gecorreleerd zijn.
Scatterplot van twee niet-gecorreleerde variabelen met een trendlijn. De spreidingsplot laat zien dat wanneer X toeneemt, Y soms toeneemt en soms afneemt. Er is geen specifiek patroon voor de gegevens. De punten lijken willekeurig verspreid over het diagram. Als gevolg hiervan is de trendlijn bijna vlak en dit geeft aan dat X en Y
niet-gecorreleerd zijn.Voor een voorbeeld uit de praktijk toont deze figuur een spreidingsplot van de relatie tussen de prijs van Apple-aandelen en de beursindex van Standard and Poor's 500 van 1 januari 2013 tot 31 december 2013. Scatterplot van de dagprijzen van Apple-aandelen en de S & P 500.
De Standard and Poor's 500-index (S & P 500) is een gemiddelde van de prijzen van de 500 grootste Amerikaanse aandelen. De waarde van deze index geeft de algemene toestand van de Amerikaanse economie weer. De grafiek laat zien dat er een positieve correlatie bestaat tussen de prijs van Apple-aandelen en de S & P 500.