Video: Top 10 Excel New Features 2024
Bij het analyseren van gegevens voor uw infographics, moet u zich ervan bewust zijn dat sommige gegevenspunten - bekend als uitschieters - zo ver buiten de norm lagen vestig de aandacht op zichzelf. In de meest ernstige gevallen kunnen ze zelfs gegevens scheeftrekken en een misleidend beeld van het onderwerp maken. Je moet herkennen wanneer je een uitbijter hebt en vervolgens beslissen wat je eraan moet doen.
Deze tabel bevat een eenvoudig voorbeeld om dit idee te demonstreren. De twee datasets vertegenwoordigen de cijfers van een student, gedurende acht weken, op twee wekelijkse examens; de cijfers zijn het percentage correct op het examen. De dataset aan de linkerkant (het eerste examen) bevat geen uitbijter, maar de dataset aan de rechterkant (het tweede examen) wel. De ene uitbijter wordt vetgedrukt weergegeven.
Week | Rangen (geen uitbijter) | Rangen (één uitbijter) |
---|---|---|
1 | 90% | 90% |
2 | 88% | 88% |
3 | 90% | 90% |
4 | 85% | 50% |
5 | 86% | 86% |
6 | 87% | 87% |
7 | 85% | 85% |
8 | 84% | 84% |
Gemiddelde > 87% | 83% |
|
Wat doet een gegevensjournalist in zo'n geval? Hier zijn een paar opties:
Gooi de uitbijter weg.
-
Als u alleen het gemiddelde in uw afbeelding gebruikt en u vreest dat het misleidend is, verwijdert u de uitbijter als aberratie en berekent u vervolgens het gemiddelde zonder die week, zoals weergegeven in de afbeelding.
Als u deze optie kiest, moet u een voetnoot toevoegen waarin alles wordt uitgelegd: in dit geval het verwijderen van een gegevenspunt. Wees altijd zo transparant mogelijk.
Toon de gegevens zoals ze zijn.
-
Of u nu alleen het gemiddelde in uw grafiek gebruikt of alle gegevens in een grafiek plot, u kunt de gegevens altijd exact weergeven zoals deze bij u zijn gekomen, zoals weergegeven in de volgende afbeelding. In dit geval moet u een voetnoot toevoegen waarin de uitbijter wordt opgeroepen zodat uw lezer er volledig van op de hoogte is.
Bouw een "lijn van beste pasvorm. "
-
Deze optie is alleen van toepassing als u een diagram gaat maken met alle gegevens. Een lijn van de beste aanpassing - ook wel lineaire regressie genoemd - is een visueel gemiddelde van uw gegevens: letterlijk de regel die uw verspreide gegevenspunten het best vertegenwoordigt.