Inhoudsopgave:
- De kans kennen dat een gebeurtenis plaatsvindt
- Variantie toepassen om de grootte van verandering weer te geven
- Prognoses voor de toekomst
Video: What to trust in a "post-truth" world | Alex Edmans 2024
Het woord statistieken kan bij sommige beginners angst oproepen voor gegevensvisualisatie, maar als u dit onderwerp negeert, ziet u een van de meest krachtige manieren om echt inzicht en waarde te ontlenen aan Big Data.
Statistieken is de praktijk of wetenschap van het verzamelen van numerieke gegevens in grote hoeveelheden. Je hoeft niet naar buiten te gaan en een data-wetenschapper te worden (een term die wordt gebruikt voor statistici die ook vermomde data-geeks zijn en die meestal een soort van geavanceerde graad bezitten, zoals een doctoraat), maar misschien wil je overwegen om op te halen een Statistics 101-boek of -klas als u interesse hebt.
Statistische formules zoals waarschijnlijkheid, variantie en voorspelling zijn populair vandaag. Ze zijn vrij eenvoudig toe te passen op elke dataset en de meeste lezers zullen ze duidelijk begrijpen. U kunt sommige van deze statistische formules opnemen in uw Big Data-visualisaties om echte waarde te bieden aan gebruikers door de technieken te gebruiken die in de volgende secties worden besproken.
De kans kennen dat een gebeurtenis plaatsvindt
Een statistische formule waarmee u bekend bent is p robability : de waarschijnlijkheid of kans dat een gebeurtenis zich voordoet. De volgende formule berekent de basiswaarschijnlijkheid voor een lineair scenario. (Niet-lineaire scenario's zijn een beetje ingewikkeld en een teveel voor een nieuweling.)
Waarschijnlijkheid = Waarschijnlijkheid dat een gebeurtenis plaatsvindt / aantal mogelijke uitkomsten
De volgende afbeelding toont een kans met een aantal waarschuwingskleuren toegevoegd om de gemakkelijk leesbare boodschap en, het belangrijkste, om duidelijk aan te geven dat onmiddellijke actie nodig is.
Kansen bieden een snelle realiteitscheck en stellen de algehele toon in voor het verhaal dat de gegevensvisualisatie gedurende een bepaalde periode (dag, week, kwartaal, enzovoort) zal opleveren.
Variantie toepassen om de grootte van verandering weer te geven
Een andere populaire statistische meetwaarde is v ariance , , wat het verschil is tussen een set gegevenspunten.
De meest gebruikte formule voor het berekenen van variantie is
Variantie = laatste gewenst - huidige staat
Of de weergegeven uitvoer een geheel getal of percentage is, de formule geeft de grootte van de verandering tussen de begin- en eindstand van een gegevenspunt.
Het weergeven van de variantie is altijd een snelle overwinning en een goede vervanging voor de combinatie van lijn- / staafdiagrammen. Zo wordt de variatierelatie in de meeste visualisaties weergegeven.
Het diagram in de onderstaande afbeelding toont een lijn- / staafdiagramcombinatie waarmee de gebruiker de variantie voor elke maand kan ontcijferen.
Het tweede diagram, weergegeven in de volgende afbeelding, geeft de variantie duidelijk weer en neemt al het giswerk uit het visuele.
Prognoses voor de toekomst
Nog een andere populaire statistische formule waarmee u bekend bent, is de f orecast , , waarmee u een gebeurtenis of trend kunt voorspellen of schatten.
Wanneer u een prognose berekent, gebruikt u echt een bepaalde hoeveelheid historische gegevens om gedrag, een specifieke gebeurtenis of een trend te voorspellen. U kunt bijvoorbeeld de omzet voor het jaar berekenen op basis van het historische feit dat januari doorgaans goed is voor 5% van de omzet. Als u in januari $ 500 heeft verdiend, gebruikt u de volgende formule om te voorspellen hoeveel verkopen u voor het jaar kunt verwachten:
$ 500 /. 05 = $ 10, 000
In deze vergelijking is $ 500 de verkoop in januari;. 05 is het historische percentage van de verkopen dat januari goed is; en $ 10.000 is de verwachte verkoop voor het jaar.
In de onderstaande afbeelding ziet u hoe prognoses in de meeste gegevensvisualisaties worden weergegeven als een eenvoudige lijn in een grafiek. Prognoses geven aan hoe een bepaalde activiteit in de toekomst kan presteren.
Deze typische weergave van een prognoseregel laat zien dat de cashflow uiteindelijk een probleem voor deze organisatie zal worden.