Video: Data Analysis: Graphical Representation - Mathematics - Probability and Statistics - TU Delft 2024
Wellicht de meest gebruikelijke tool voor gegevensanalyses die u in Excel zult gebruiken, is die voor het berekenen van beschrijvende statistieken. Bekijk dit werkblad om te zien hoe dit werkt. Het vat verkoopgegevens samen voor een uitgever van boeken.
In kolom A geeft het werkblad de voorgestelde verkoopprijs (SRP) weer. In kolom B geeft het werkblad de verkochte eenheden van elk boek weer in één van de populaire boekenverkooppunten. U kunt ervoor kiezen om de tool Descriptieve statistieken te gebruiken om deze gegevensset samen te vatten.
Ga als volgt te werk om beschrijvende statistieken voor de gegevensset te berekenen:
-
Klik op de knop Gegevensanalyse van het tabblad Gegevens om aan Excel te vertellen dat u beschrijvende statistieken wilt berekenen.
Excel geeft het dialoogvenster Gegevensanalyse weer.
-
Markeer in het dialoogvenster Data Analysis het item Descriptive Statistics in de lijst Analysis Tools en klik vervolgens op OK.
Excel geeft het dialoogvenster Beschrijvende statistiek weer.
-
Identificeer in de sectie Input van het dialoogvenster Descriptive Statistics de gegevens die u wilt beschrijven.
-
Om de gegevens te identificeren die u statistisch wilt beschrijven: Klik op het tekstvak Invoerbereik en voer vervolgens de referentie voor het werkbladbereik voor de gegevens in. In het geval van het voorbeeldwerkblad is het invoerbereik $ A $ 1: $ C $ 38. Merk op dat Excel wil dat het bereikadres absolute referenties gebruikt - vandaar de dollartekens.
Om het gemakkelijker te maken het werkbladbereik te zien of te selecteren, klikt u op de werkbladknop aan het rechteruiteinde van het tekstvak Invoerbereik. Wanneer Excel het dialoogvenster Beschrijvende statistiek verbergt, selecteert u het bereik dat u wilt door de muis te slepen. Klik vervolgens opnieuw op de werkbladknop om het dialoogvenster Descriptieve statistieken opnieuw weer te geven.
-
Bepalen of de gegevens zijn gerangschikt in kolommen of rijen: Selecteer het keuzerondje Kolommen of Rijen.
-
Om aan te geven of de eerste rij labels bevat die de gegevens beschrijven: Schakel het selectievakje Labels in eerste rij in. In het geval van het voorbeeldwerkblad zijn de gegevens gerangschikt in kolommen en bevat de eerste rij wel labels, dus u selecteert het keuzerondje Kolommen in het vak en het vak Labels in eerste rij.
-
-
Beschrijf in het gebied Uitvoeropties van het dialoogvenster Beschrijvende statistiek waar en hoe Excel de statistieken moet produceren.
-
Om aan te geven waar de beschrijvende statistieken die door Excel worden berekend, moeten worden geplaatst: Kies hier uit de drie keuzerondjes - Uitvoerbereik, Nieuwe werkbladovergang en Nieuwe werkmap. Meestal plaatst u de statistieken in een nieuw werkblad in de bestaande werkmap.Selecteer hiervoor gewoon het keuzerondje New Worksheet Ply.
-
Om te bepalen welke statistische meetwaarden u wilt laten berekenen: Schakel de selectievakjes Uitvoeropties in. Schakel het selectievakje Samenvattingsstatistieken in om Excel te laten berekenen wat statistische meetwaarden zijn, zoals gemiddelde, modus en standaardafwijking. Selecteer het selectievakje Betrouwbaarheidsniveau voor gemiddelde om aan te geven dat u een betrouwbaarheidsniveau wilt dat is berekend voor het steekproefgemiddelde.
Opmerking: Als u een betrouwbaarheidsniveau voor het steekproefgemiddelde berekent, moet u het percentage van het betrouwbaarheidsniveau invoeren in het tekstvak. Gebruik de selectievakjes Kth Largest en Kth Smallest om aan te geven dat u de grootste of kleinste waarde in de dataset wilt vinden.
Nadat u hebt beschreven waar de gegevens zich bevinden en hoe de statistieken moeten worden berekend, klikt u op OK. Dit zijn de statistieken die Excel berekent.
Statistiek Beschrijving Gemiddelde Geeft het rekenkundig gemiddelde van de voorbeeldgegevens weer. Standaardfout Geeft de standaardfout van de gegevensset weer (een maat voor het verschil tussen de voorspelde waarde en de werkelijke waarde).
Mediaan Geeft de middelste waarde in de gegevensset weer (de waarde die scheidt de grootste helft van de waarden van de kleinste helft van
de waarden).
Modus Geeft de meest voorkomende waarde in de gegevensset weer. Standaarddeviatie Toont de standaarddevieafwijkingsmaat voor de reeks gegevens .
Voorbeeldvariantie Geeft de steekproefvariantie voor de gegevensverzameling weer (de standaardafwijking in het vierkant). Kurtosis Geeft de kurtosis van de verdeling weer. Skewness Geeft de scheefheid van de verdeling van de dataset weer. Bereik Geeft het verschil weer tussen de grootste en de kleinste waarden in de gegevensset.
Minimum Geeft de kleinste waarde in de gegevensset weer. Maximum Geeft de grootste waarde in de gegevensset weer. Som Voegt alle waarden in de gegevensset samen toe om de som te berekenen.
Telling Telt het aantal waarden in een gegevensset. Grootste ( X ) Geeft de grootste X waarde in de gegevensset weer. Kleinste ( X ) Geeft de kleinste X -waarde in de gegevensset weer. Vertrouwensniveau ( X ) Percentage Geeft het betrouwbaarheidsniveau weer bij een bepaald percentage voor de ingestelde gegevens .
-
Hier is een nieuw werkblad met de berekende beschrijvende statistieken.