Inhoudsopgave:
- Significant betekent niet altijd belangrijk
- Wanneer u probeert een regressiemodel in een scatterplot te passen, is de verleiding om onmiddellijk een lijn te gebruiken. Dit is het best begrepen regressiemodel en als je het onder de knie hebt, zijn hellingen en onderscheppingen niet zo afschrikwekkend.
- Of u nu werkt met lineaire regressie of kromlijnige regressie, houd er rekening mee dat het ongepast is om buiten de grenzen van de scatterplot te generaliseren.
- Zorgvuldige analyse van residuen (de verschillen tussen waargenomen en voorspelde waarden) kan u veel vertellen over hoe goed de lijn past bij de gegevens. Een fundamentele aanname is dat de variabiliteit rond een regressielijn hetzelfde is op en neer de rij.Als dat niet zo is, is het model mogelijk niet zo voorspellend als u denkt. Als de variabiliteit systematisch is (grotere variabiliteit aan het ene uiteinde dan aan het andere uiteinde), kan kromlijnige regressie meer geschikt zijn dan lineair. De standaard error of estimate zal niet altijd de indicator zijn.
- Geloof het of niet, dit gebeurt soms met correlatiecoëfficiënten. Een zeer groot monster kan een kleine correlatiecoëfficiënt statistisch significant maken.
- Om alle resultaten samen te vatten, gebruikt u de grafische mogelijkheden van Excel om een grafiek te maken.
- Middelen op zichzelf vertellen je niet altijd het hele verhaal. Grijp elke gelegenheid om varianties en standaarddeviaties te onderzoeken. Mogelijk vindt u enkele verborgen nuggets. Systematische variatie - hoge variantiegrens geassocieerd met grote middelen, bijvoorbeeld - kan een aanwijzing zijn over een relatie die u niet eerder zag.
- Het verbinden van tekstboekconcepten met de statistische functies van Excel kan een uitdaging zijn vanwege de teksten en vanwege Excel. Berichten in dialoogvensters en in Help-bestanden kunnen andere symbolen bevatten dan die waarover u leest, of ze kunnen dezelfde symbolen gebruiken, maar op een andere manier. Deze discrepantie kan ertoe leiden dat u een onjuiste invoer in een parameter in een dialoogvenster invoert, wat resulteert in een moeilijk te traceren fout.
Video: Montgomery Childs: SAFIRE Project Update | EU2016 2024
De wereld van statistieken zit vol valkuilen, maar het biedt ook veel kansen. Of je nu een gebruiker bent van statistieken of iemand die ze moet interpreteren, het is mogelijk om in de valkuilen te vallen. Het is ook mogelijk om eromheen te lopen. Hier zijn tien tips en vallen uit de gebieden van hypothesetesten, regressie, correlatie en grafiek.
Significant betekent niet altijd belangrijk
Significantie is in veel opzichten een slecht gekozen term. Wanneer een statistische test een significant resultaat oplevert en de beslissing is om H 0 af te wijzen, kan dat niet garanderen dat de studie achter de gegevens een belangrijke is. Statistieken kunnen alleen helpen bij het nemen van beslissingen over getallen en conclusies over de processen die ze hebben geproduceerd. Ze kunnen die processen niet belangrijk maken of de aarde vernietigen. Het belang is iets dat je zelf moet beoordelen - en geen statistische test kan dat voor je doen.
Wanneer u probeert een regressiemodel in een scatterplot te passen, is de verleiding om onmiddellijk een lijn te gebruiken. Dit is het best begrepen regressiemodel en als je het onder de knie hebt, zijn hellingen en onderscheppingen niet zo afschrikwekkend.
Maar lineaire regressie is niet de enige vorm van regressie. Het is mogelijk om een curve door een scatterplot te laten passen. Laat je niet misleiden: de statistische concepten achter kromlijnige regressie zijn moeilijker te begrijpen dan de concepten achter lineaire regressie.
Extrapoleren buiten een voorbeeldscatterplot is een slecht idee
Of u nu werkt met lineaire regressie of kromlijnige regressie, houd er rekening mee dat het ongepast is om buiten de grenzen van de scatterplot te generaliseren.
Stel dat u een goede voorspellende relatie hebt gevonden tussen een test van geschiktheid voor wiskunde en prestaties in wiskundecursussen en dat uw spreidingsdiagram slechts een beperkt aantal wiskundevaardigheden bevat. Je hebt geen manier om te weten of de relatie buiten dat bereik blijft. Voorspellingen buiten dat bereik zijn niet geldig.
Onderzoek de variabiliteit rond een regressielijn
Zorgvuldige analyse van residuen (de verschillen tussen waargenomen en voorspelde waarden) kan u veel vertellen over hoe goed de lijn past bij de gegevens. Een fundamentele aanname is dat de variabiliteit rond een regressielijn hetzelfde is op en neer de rij.Als dat niet zo is, is het model mogelijk niet zo voorspellend als u denkt. Als de variabiliteit systematisch is (grotere variabiliteit aan het ene uiteinde dan aan het andere uiteinde), kan kromlijnige regressie meer geschikt zijn dan lineair. De standaard error of estimate zal niet altijd de indicator zijn.
Een voorbeeld kan te groot zijn
Geloof het of niet, dit gebeurt soms met correlatiecoëfficiënten. Een zeer groot monster kan een kleine correlatiecoëfficiënt statistisch significant maken.
Maar wat betekent die correlatiecoëfficiënt eigenlijk? De determinatiecoëfficiënt -r
2 - is rechtvaardig. 038, wat betekent dat de SS Regressie minder is dan 4 procent van de SS Total . Dat is een heel kleine associatie. Bottom line: wanneer u naar een correlatiecoëfficiënt kijkt, moet u rekening houden met de steekproefomvang. Als het groot genoeg is, kan het een triviale associatie statistisch significant maken. (Hmmm … betekenis
- daar is het weer!) Consumenten: ken je assen Als je naar een grafiek kijkt, zorg er dan voor dat je weet wat er op elke as staat. Zorg ervoor dat u de maateenheden begrijpt. Begrijpt u de onafhankelijke variabele? Begrijpt u de afhankelijke variabele? Kun je een ieder in je eigen woorden beschrijven? Als het antwoord op een van deze vragen "Nee" is, begrijpt u de grafiek niet waar u naar kijkt.
Let goed op wanneer een grafiek in een tv-advertentie wordt bekeken als deze te snel verdwijnt, voordat u kunt zien wat op de assen staat. De adverteerder probeert mogelijk een blijvende valse indruk te maken over een valse relatie in de grafiek. De grafische relatie kan net zo geldig zijn als die andere nietje van tv-reclame - wetenschappelijk bewijs via geanimeerde cartoon: kleine geanimeerde scrubborstels die cartoontanden schoonmaken, hoeven niet noodzakelijkerwijs witte tanden te garanderen als u het product koopt.
Het in kaart brengen van een categorische variabele alsof het een kwantitatieve variabele is, is gewoon fout
Dus je bent bijna klaar om deel te nemen aan de Rock-Paper-Scissors World Series. Als voorbereiding op dit internationale toernooi heb je al je wedstrijden van de afgelopen tien jaar bijgehouden, met het percentage keren dat je hebt gewonnen toen je elke rol speelde.Om alle resultaten samen te vatten, gebruikt u de grafische mogelijkheden van Excel om een grafiek te maken.
Zoveel mensen creëren dit soort grafieken - mensen die beter moeten weten. De lijn in de grafiek impliceert continuïteit van het ene punt naar het andere. Met deze gegevens is dat natuurlijk onmogelijk. Wat zit er tussen steen en papier? Waarom zijn ze gelijk eenheden uit elkaar? Waarom zijn de drie categorieën in die volgorde?
Eenvoudig gezegd is een lijngrafiek niet de juiste grafiek als ten minste een van uw variabelen een reeks categorieën is. Maak in plaats daarvan een kolomgrafiek. Een cirkeldiagram werkt hier ook, omdat de gegevens percentages zijn en u slechts een paar segmenten hebt.Voeg, indien van toepassing, variabiliteit in uw grafiek toe
Wanneer de punten in uw grafiek middelen vertegenwoordigen, zorg er dan voor dat de grafiek de standaardfout van elk gemiddelde bevat.Dit geeft de kijker een idee van de variabiliteit in de gegevens - wat een belangrijk aspect van de gegevens is.
Middelen op zichzelf vertellen je niet altijd het hele verhaal. Grijp elke gelegenheid om varianties en standaarddeviaties te onderzoeken. Mogelijk vindt u enkele verborgen nuggets. Systematische variatie - hoge variantiegrens geassocieerd met grote middelen, bijvoorbeeld - kan een aanwijzing zijn over een relatie die u niet eerder zag.
Wees voorzichtig met het vergelijken van statistische tekstboekconcepten met Excel
Als je serieus bezig bent met statistisch werk, zul je waarschijnlijk de gelegenheid hebben om naar een of twee statistische teksten te kijken. Houd er rekening mee dat de symbolen in sommige statistische gebieden niet standaard zijn.