Video: Module 1: Data Analysis in Excel 2024
Door Stephen L. Nelson
Excel 2007 heeft geweldige hulpprogramma's voor gegevensanalyse. U kunt elke gewenste statistiek maken; zorg er gewoon voor dat je weet wat de statistiek betekent. Daarvoor moet u de beschikbare statistische meetwaarden, de Booleaanse uitdrukkingen Excel 2007 en de Excel 2007-databasefuncties kennen.
Excel 2007-databasefuncties
De gegevensanalysetools van Excel 2007 bevatten een reeks databasefuncties voor het maken van statistische berekeningen met behulp van informatie uit lijsten. De volgende tabel toont deze functies en legt uit wat elk doet:
Functie | Beschrijving |
---|---|
DAVERAGE | Berekent rekenkundig gemiddelde |
DCOUNT | Telt het aantal cellen met waarden |
DCOUNTA | Telt het aantal cellen die niet leeg zijn |
DGET | Retourneert een waarde uit een databaselijst |
DMAX | Zoekt de grootste waarde in een lijst |
DMIN | Zoekt de kleinste waarde in een lijst |
DPRODUCT | Berekent het product van waarden die overeenkomen met criteria |
DSTDEV | Berekent de standaarddeviatie van een steekproef |
DSTDEVP | Berekent de standaarddeviatie van een populatie |
DSUM | Berekent de som van waarden die overeenkomen met criteria |
DVAR | Berekent de variantie van een steekproef |
DVARP | Berekent de variantie van een populatie |
Al deze databasefuncties gebruiken een standaard syntaxis met drie argumenten. De DAVERAGE-functie ziet er bijvoorbeeld als volgt uit: = DAVERAGE (database, veld, criteria) waarbij database een bereikverwijzing is naar de Excel-lijst die de waarde bevat die u wilt onderzoeken, veld vertelt Excel welke kolom in de database moet worden onderzocht en criteria is een bereikverwijzing die de velden en waarden identificeert die worden gebruikt om uw selectiecriteria te definiëren. Het veldargument kan een celverwijzing zijn met de veldnaam, de veldnaam tussen aanhalingstekens of een nummer dat de kolom identificeert (1 voor de eerste kolom, 2 voor de tweede kolom, enzovoort).
Snelle analyse van Excel 2007 vanuit de statusbalk
Excel 2007 kan u vrij veel vertellen over een geselecteerd celbereik, net vanuit de statusbalk. Wanneer u cellen selecteert die gegevens in zich hebben, kunt u in de statusbalk van Excel nuttige informatie over die cellen weergeven. Wanneer u met de rechtermuisknop op de statusbalk klikt, geeft Excel een pop-upmenu weer dat verschillende statistische meetwaarden bevat die u over het geselecteerde bereik kunt maken; ze worden weergegeven in de volgende tabel:
Statistische maatregelen Optie | Wat doet het | Statistische metingen Optie | Wat het doet |
---|---|---|---|
[Geen] | Vertelt Excel dat u niet wilt het om een
statistiek op de statusbalk te berekenen en weer te geven. |
Maximum | Zoekt de grootste waarde in het geselecteerde bereik |
Gemiddelde | Zoekt het gemiddelde van waarden in het geselecteerde bereik. | Minimum | Zoekt de kleinste waarde in het geselecteerde bereik |
Telling | Komt overeen met de cellen met labels, waarden of formules. Gebruik
dit als u het aantal cellen dat niet leeg is wilt tellen. |
Som | Voegt de waarden toe in het geselecteerde bereik |
Numerieke telling | Komt overeen met het aantal cellen in een geselecteerd bereik met
waarden of formules. |
Booleaanse expressies gebruiken in gegevensanalyse met Excel 2007
Gegevensanalyse-instrumenten in Excel 2007 omvatten natuurlijk Booleaanse uitdrukkingen. Als u een Booleaanse expressie wilt maken, zoals wanneer u criteria filtert, gebruikt u een vergelijkingsoperator en vervolgens een waarde in de vergelijking (> 5, bijvoorbeeld). In de volgende tabel worden de Excel-vergelijkingsoperatoren weergegeven en wat ze vertegenwoordigen:
Comparison Operator | What It means |
---|---|
= | Is gelijk aan >> |
Groter dan >> = | Groter dan of gelijk aan |
<< Minder dan | <= |
Minder dan of gelijk aan | Niet gelijk aan |
Statistieken die u moet kennen bij het gebruik van Excel 2007-tools voor gegevensanalyse | de data-analysetools die beschikbaar zijn in Excel 2007, kunt u spreadsheets maken die de details van elke statistiek tonen waar u een formule voor kunt vinden om te vinden - en u kunt elk nummer vinden. Het helpt om te weten wat u zoekt en wat u kunt verwachten en de termen in de volgende lijst helpen u te begrijpen welke soorten statistieken u kunt produceren. |
gemiddelde: |
Typisch is een gemiddelde het rekenkundig gemiddelde voor een reeks waarden. Excel levert verschillende gemiddelde functies.
chikwadraat:
-
Gebruik chikwadraten om waargenomen waarden te vergelijken met verwachte waarden, waarbij het niveau van significantie of waarschijnlijkheid wordt geretourneerd (ook een p-waarde
-
genoemd). Een p-waarde helpt u te beoordelen of verschillen tussen de waargenomen en verwachte waarden toeval zijn. kruistabel: Dit is een analysetechniek die gegevens op twee of meer manieren samenvat. Het samenvatten van verkoopinformatie, zowel per klant als product, is een kruistabel. beschrijvende statistiek:
-
Beschrijvende statistiek beschrijft alleen de waarden in een set. Als u bijvoorbeeld een reeks waarden optelt, is die som een beschrijvende statistiek. Het vinden van de grootste waarde of de kleinste waarde in een reeks getallen is ook een beschrijvende statistiek. exponentiële afvlakking:
-
Exponentiële afvlakking berekent het voortschrijdend gemiddelde, maar weegt de waarden die zijn opgenomen in de voortschrijdend gemiddelde berekeningen, zodat recentere waarden een groter effect hebben. inferentiële statistieken:
-
Inferentiële statistieken zijn gebaseerd op het zeer nuttige, intuïtieve idee dat als u naar een steekproef van waarden uit een populatie kijkt en de steekproef representatief en groot genoeg is, u conclusies kunt trekken over de populatie op basis van kenmerken van het monster. kurtosis:
-
Dit is een maat voor de staarten in een verdeling van waarden. median:
-
De mediaan is de middelste waarde in een reeks waarden. De helft van de waarden valt onder de mediaan en de helft van de waarden valt boven de mediaan. modus:
-
Mode is de meest voorkomende waarde in een set. voortschrijdend gemiddelde:
-
Een voortschrijdend gemiddelde wordt berekend met alleen een opgegeven reeks waarden, zoals een gemiddelde op basis van alleen de laatste drie waarden. normale verdeling:
-
Ook bekend als een Gauss-verdeling, is normale verdeling de beruchte belcurve. p-waarde:
-
Een p-waarde is het significantieniveau of de waarschijnlijkheid. regressieanalyse:
-
Regressieanalyse omvat het plotten van paren onafhankelijke en afhankelijke variabelen in een XY-diagram en vervolgens het vinden van een lineaire of exponentiële vergelijking die de geplotte gegevens het beste beschrijft. skewness:
-
Dit is een maat voor de symmetrie van een verdeling van waarden. standaardafwijking:
-
een standaardafwijking beschrijft spreiding over het gemiddelde van de gegevensset. U kunt een standaarddeviatie bedenken als een gemiddelde
-
afwijking van het gemiddelde. variantie: een variantie beschrijft spreiding over het gemiddelde van de gegevensset. De variantie is het kwadraat van de standaarddeviatie; de standaardafwijking is de vierkantswortel van de variantie. z-waarde
-
: dit is de afstand tussen een waarde en het gemiddelde in termen van standaardafwijkingen.