Te gebruiken 10 dingen die u moet weten over statistieken om Excel te gebruiken - dummies

Excel is een geweldig hulpmiddel wanneer u statistieken moet gebruiken. Als u nog nooit bent blootgesteld aan statistieken op school of het is al een decennium of twee geleden dat u zich bevond, laat deze tips u dan helpen enkele van de statistische hulpmiddelen te gebruiken die Excel biedt.

Beschrijvende statistiek is eenvoudig

Het eerste dat u moet weten, is dat enkele statistische analyses en enkele statistische maatregelen vrij eenvoudig zijn. Beschrijvende statistiek, die zaken zoals de kruistabel kruistabellen, evenals enkele van de statistische functies omvat, is zelfs zinvol voor iemand die niet zo kwantitatief is.

Gemiddelden zijn niet zo eenvoudig soms

Wanneer iemand de term gemiddeld gebruikt, verwijst hij meestal naar de meest gebruikelijke gemiddelde meting, namelijk gemiddelde. Als u begrijpt dat de term gemiddeld onnauwkeurig is, is veel van de statistische functionaliteit van Excel begrijpelijker.

Om deze discussie concreter te maken, ga je ervan uit dat je kijkt naar een kleine reeks waarden: 1, 2, 3, 4 en 5. Zoals je misschien weet, is het gemiddelde in deze kleine set waarden 3. U kunt het gemiddelde berekenen door alle getallen in de set bij elkaar op te tellen (1 + 2 + 3 + 4 + 5) en deze som vervolgens te verdelen (15) met het totale aantal waarden in de set (5).

De mediaanwaarde is de waarde die de grootste waarden scheidt van de kleinste waarden. In de gegevensverzameling 1, 2, 3, 4 en 5 is de mediaan 3. De waarde 3 scheidt de grootste waarden (4 en 5) van de kleinste waarden (1 en 2).

U hoeft geen andere gemiddelde metingen te begrijpen, maar u moet niet vergeten dat de term gemiddeld vrij onnauwkeurig is.

Standaardafwijkingen beschrijven dispersie

De formule voor standaardafwijking en de logica zijn redelijk eenvoudig te begrijpen.

Een standaarddeviatie beschrijft hoe waarden in een gegevensset rond het gemiddelde variëren. Het mooie van statistische metingen zoals een standaardafwijking, krijgt u vaak echte inzichten in de kenmerken van de gegevens die u bekijkt. Een ander ding is dat met deze twee stukjes gegevens, je vaak conclusies kunt trekken over data door naar samples te kijken.

Een waarneming is een waarneming

Waarneming is een van de termen die u tegenkomt als u iets over statistieken leest. Een waarneming is slechts een observatie. Een manier om de term observatie te definiëren, is als volgt: wanneer u een waarde aan een van uw willekeurige variabelen toewijst, maakt u een waarneming.

Een voorbeeld is een subset van waarden

A voorbeeld is een verzameling waarnemingen van een populatie. Als u bijvoorbeeld een gegevensset maakt die de dagelijkse hoge temperatuur in uw buurt registreert, is uw kleine verzameling waarnemingen een voorbeeld.

Ter vergelijking: een steekproef is geen populatie. A bevolking bevat alle mogelijke waarnemingen.

Inductieve statistieken zijn cool maar gecompliceerd

Als u een steekproef van waarden uit een populatie bekijkt en de steekproef representatief en groot genoeg is, kunt u conclusies trekken over de populatie op basis van de kenmerken van de steekproef.

Inductieve statistieken, hoewel zeer krachtig, hebben twee kwaliteiten die u moet kennen:

Nauwkeurigheidsproblemen
Steile leercurve

Kansverdeling-functies zijn niet altijd verwarrend

P gegevens over robabiliteit functie klinkt vrij lastig; maar je kunt intuïtief begrijpen wat een kansverdelingsfunctie is met een paar bruikbare voorbeelden.

Eén algemene distributie waarover u bijvoorbeeld in statistiekenklassen hoort, is een T-verdeling. Een T-verdeling is in wezen een normale verdeling behalve met zwaardere, dikkere staarten.

Eén algemene kansverdelingsfunctie is een uniforme verdeling. In een uniforme verdeling, heeft elke gebeurtenis dezelfde waarschijnlijkheid van voorkomen. Het unieke aan deze distributie is dat alles behoorlijk klinkklare niveau is.

Een ander veelvoorkomend type kansverdelingsfunctie is de normale verdeling, ook bekend als een klokkromme of een Gausse verdeling.

Een normale verdeling is van nature in veel situaties het geval. Bijvoorbeeld, intelligentiequota (IQ's) worden normaal verdeeld.

Parameters zijn niet zo ingewikkeld

A parameter is een invoer voor de kansverdelingsfunctie. Met andere woorden, de formule of functie of vergelijking die een kansverdelingscurve beschrijft, heeft invoer nodig. In statistieken worden deze ingangen parameters genoemd.

Sommige kansverdelingsfuncties hebben slechts één eenvoudige parameter nodig. Als u bijvoorbeeld met een uniforme verdeling wilt werken, heeft u alleen maar het aantal waarden in de gegevensset nodig. Een zeszijdige dobbelsteen heeft bijvoorbeeld slechts zes mogelijkheden.

Skewness en kurtosis beschrijven de vorm van een kansverdeling

Een paar andere bruikbare statistische termen om te weten zijn skewness en kurtosis. Skewness kwantificeert het ontbreken van symmetrie in een kansverdeling. In een perfect symmetrische verdeling, zoals de normale verdeling, is de scheefheid gelijk aan nul. Als een kansverdeling naar rechts of naar links leunt, is de scheefheid echter gelijk aan een andere waarde dan nul, en de waarde kwantificeert het gebrek aan symmetrie.

Kurtosis kwantificeert de zwaarte van de staarten in een verdeling. In een normale verdeling is kurtosis gelijk aan nul. De staart is het ding dat naar links of rechts reikt. Als een staart in een verdeling echter zwaarder is dan een normale verdeling, is de kurtosis een positief getal.Als de staarten in een verdeling magerder zijn dan bij een normale verdeling, is de kurtosis een negatief getal.

Betrouwbaarheidsintervallen lijken in eerste instantie ingewikkeld, maar zijn nuttig

Kans verwart mensen vaak. Een belangrijk aspect van vertrouwensniveaus is dat ze zijn gekoppeld aan de foutenmarge.

Wat ook belangrijk is om te begrijpen over betrouwbaarheidsniveaus, is dat hoe groter u uw steekproefomvang maakt, hoe kleiner uw foutenmarge hetzelfde betrouwbaarheidsniveau zal gebruiken.

Stel dat u enkele Google Analytics-gegevens had over twee verschillende webadvertenties die u gebruikt om uw kleine bedrijf te promoten, en u wilt weten welke advertentie effectiever is. U kunt de formule voor het betrouwbaarheidsinterval gebruiken om uit te zoeken hoe lang uw advertenties moeten worden weergegeven voordat Google genoeg gegevens heeft verzameld om u te laten weten welke advertentie echt beter is.