Video: The unheard story of David and Goliath | Malcolm Gladwell 2024
Zorg ervoor dat u zorgvuldig controleert op uitbijters vóór ze uw voorspellende analyse beïnvloeden. Uitschieters kunnen zowel de gegevens- als de gegevensanalyse verstoren. Statistische analyses uitgevoerd met gegevens die uitbijters op hun plaats houden, zorgen er bijvoorbeeld voor dat de gemiddelden en varianties worden scheef getrokken.
Niet-gecontroleerde of verkeerd geïnterpreteerde uitbijters kunnen leiden tot valse conclusies. Zeg uw gegevens die aantonen dat een aandeel een heel jaar lang voor een prijs van meer dan $ 50 werd verhandeld - maar voor slechts een paar minuten uit dat hele jaar werd het aandeel op $ 20 verhandeld. De prijs van $ 20 - een voor de hand liggende uitzondering - is de uitbijter in deze dataset.
Nu moet u beslissen of u de $ 20 aandelenkoers in uw analyse wilt opnemen; als u dat doet, heeft dit consequenties voor het totale model. Maar wat vindt u normaal? Was de & ldquo; flash-crash & rdquo; dat de beurs op 6 mei 2010 verrast, een normaal evenement of een uitzondering?
Gedurende die korte tijd kende de aandelenmarkt een scherpe prijsdaling over de hele linie - waardoor de prijs van het monster daalde van $ 50 naar $ 20, maar minder met de voorraad te maken had dan met de bredere marktomstandigheden. Moet uw model rekening houden met de grotere schommelingen van de aandelenmarkt?
Iedereen die geld kwijtraakt tijdens korte momenten van vrije val, beschouwt die paar minuten als echt en normaal (zelfs als ze zich een eeuwigheid voelden om doorheen te gaan). Een portefeuille die in milliseconden afneemt als gevolg van een snelle achteruitgang, hoewel van korte duur, is duidelijk reëel. Toch is de flash-crash een anomalie, een uitbijter die een probleem vormt voor het model.
Ongeacht wat als normaal wordt beschouwd (wat toch kan veranderen), bevat data soms waarden die niet in de verwachte waarden passen. Dit geldt met name voor de aandelenmarkt, waar vrijwel elk evenement de markt kan laten vliegen of kelderen. Je wilt niet dat je model faalt als de realiteit plotseling verandert - maar een model en een realiteit zijn twee verschillende dingen.