Inhoudsopgave:
- Tabular visualisaties gebruiken voor voorspellende analyse
- Staafdiagrammen gebruiken in voorspellende analyse
- Basisprincipes van cirkeldiagrammen voor voorspellende analyse
- Grafiekdiagrammen gebruiken voor voorspellende analyse
- Basisprincipes van woordwolken voor voorspellende analyse
- Hoe representatie van stroomdenden te gebruiken voor voorspellende analyse
Video: Unsampled Reports and Custom Tables - Part 2 2024
Een foto zegt meer dan duizend woorden, vooral als u probeert uw voorspellende analysegegevens goed onder de knie te krijgen. Tijdens de voorbereidende stap, terwijl u uw gegevens voorbereidt, is het een gebruikelijke gewoonte om te visualiseren wat u in handen hebt voordat u doorgaat naar de volgende stap.
U begint met een spreadsheet zoals Microsoft Excel om een gegevensmatrix te maken - die bestaat uit kandidaatgegevens functies (ook wel -attributen genoemd). Verschillende Business Intelligence-softwarepakketten (zoals Tableau) kunnen u een voorlopig overzicht geven van de gegevens waarop u Analytics gaat toepassen.
Tabular visualisaties gebruiken voor voorspellende analyse
Tabellen zijn de eenvoudigste, meest elementaire beeldrepresentatie van gegevens. Tabellen (ook bekend als spreadsheets ) bestaan uit rijen en kolommen - die respectievelijk overeenkomen met de objecten en hun kenmerken die eerder zijn genoemd als samenstellen van uw gegevens. Overweeg bijvoorbeeld online sociale netwerkgegevens. Een data-object kan een gebruiker vertegenwoordigen. Attributen van een gebruiker (data-object) kunnen rubrieken zijn van kolommen: geslacht, postcode of geboortedatum.
De cellen in een tabel vertegenwoordigen waarden. Visualisatie in tabellen helpt u eenvoudig ontbrekende attribuutwaarden van gegevensobjecten te herkennen.
Tabellen kunnen ook de flexibiliteit bieden om nieuwe attributen toe te voegen die combinaties zijn van andere attributen. In sociale netwerkgegevens kunt u bijvoorbeeld een andere kolom toevoegen met de naam Leeftijd, die eenvoudig kan worden berekend - als een afgeleid kenmerk - van het bestaande kenmerk Datum van geboorte. De tabelvormige sociale netwerkgegevens tonen een nieuwe kolom, Leeftijd, gemaakt op basis van een andere bestaande kolom (geboortedatum).
Staafdiagrammen gebruiken in voorspellende analyse
Staafdiagrammen kunnen worden gebruikt om spikes of anomalieën in uw gegevens te herkennen. U kunt het voor elk attribuut gebruiken om snel minimale en maximale waarden te bekijken. Staafdiagrammen kunnen ook worden gebruikt om een discussie op te starten over hoe u uw gegevens kunt normaliseren.
Normalisatie is de aanpassing van sommige - of alle - attribuutwaarden op een schaal die de gegevens bruikbaarder maakt. U kunt bijvoorbeeld gemakkelijk zien dat er een fout in de gegevens zit: de leeftijdsbalk op één record is negatief. Die anomalie wordt gemakkelijker weergegeven door een staafdiagram dan door een gegevenstabel.
Basisprincipes van cirkeldiagrammen voor voorspellende analyse
Cirkeldiagrammen worden voornamelijk gebruikt om percentages weer te geven. Ze kunnen eenvoudig de verdeling van verschillende items illustreren en de meest dominante markeren. Onbewerkte gegevens van een sociaal netwerk worden weergegeven volgens het kenmerk Age.Merk op dat de grafiek niet alleen een duidelijke verdeling van mannen versus vrouwen laat zien, maar ook een waarschijnlijke fout: R als een waarde voor het geslachts type die mogelijk is gemaakt toen de gegevens werden verzameld.
Grafiekdiagrammen gebruiken voor voorspellende analyse
Grafiektheorie biedt een reeks krachtige algoritmen die gegevens gestructureerd en weergegeven als een grafiek kunnen analyseren. In de informatica is een grafiek de gegevensstructuur, een manier om gegevens te ordenen die de relaties tussen paren van gegevensobjecten vertegenwoordigen. Een grafiek bestaat uit twee hoofdonderdelen:
-
Hoekpunten, ook bekend als knooppunten
-
Randen, die paren knooppunten verbinden
Randen kunnen worden gericht (getekend als pijlen) en kunnen gewichten hebben. U kunt kiezen om een rand (pijl) tussen twee knooppunten (cirkels) te plaatsen - in dit geval de leden van het sociale netwerk die als vrienden met andere leden zijn verbonden:
De richting van de pijl geeft aan wie "vrienden" wie als eerste of wie de meeste interacties initieert.
Basisprincipes van woordwolken voor voorspellende analyse
Overweeg een lijst met woorden of concepten die zijn gerangschikt als een woordwolk - een grafische weergave van alle woorden in de lijst, die de grootte van elk woord als evenredig weergeven naar een waarde die u opgeeft. Als u bijvoorbeeld een spreadsheet met woorden en voorvallen heeft en de belangrijkste woorden wilt identificeren, probeert u een woordwolk.
Word-clouds werken omdat de gegevens van de meeste organisaties tekst zijn; een veelgebruikt voorbeeld is Twitter's gebruik van trending-termen. Elke term in deze afbeelding heeft een gewicht dat de grootte ervan beïnvloedt als een indicator van het relatieve belang ervan.
Een manier om dat gewicht te definiëren, kan het aantal keren zijn dat een woord in uw gegevensverzameling wordt weergegeven. Hoe vaker een woord verschijnt, hoe zwaarder het gewicht is - en hoe groter het wordt weergegeven in de cloud.
Hoe representatie van stroomdenden te gebruiken voor voorspellende analyse
Natuurlijk stroomden gedrag in het algemeen is een zelforganiserend systeem waarin objecten (in het bijzonder levende wezens) zich gedragen volgens (a) de omgeving waartoe ze behoren en (b) hun reacties op andere bestaande objecten. Het stroomgedrag van natuurlijke samenlevingen zoals die van bijen, vliegen, vogels, vissen en mieren - of mensen - is ook bekend als zwermintelligentie .
Vogels volgen natuurlijke regels wanneer ze zich gedragen als een zwerm. Koppel-partners zijn vogels die zich op een bepaalde afstand van elkaar bevinden; die vogels worden als vergelijkbaar beschouwd. Elke vogel beweegt volgens de drie hoofdregels die het vlokgedrag organiseren.
-
Scheiding: Koppel-partners mogen niet tegen elkaar botsen.
-
Uitlijning: Koppelgenoten bewegen in dezelfde gemiddelde richting als hun buren.
-
Cohesie: Koppelgenoten bewegen op basis van de gemiddelde positie of locatie van hun koppelgenoten.
Het modelleren van deze drie regels kan een analytisch systeem in staat stellen om massaal gedrag te simuleren. Door het zelfgeorganiseerde natuurlijke gedrag van stroomden vogels te gebruiken, kunt u een eenvoudige spreadsheet omzetten in een visualisatie.De sleutel is om het begrip overeenkomst te definiëren als onderdeel van uw gegevens. Begin met een paar vragen:
-
Wat maakt twee gegevensobjecten in uw gegevens vergelijkbaar?
-
Welke kenmerken kunnen de overeenkomst tussen twee gegevensrecords het beste verdelen?
Bijvoorbeeld, in sociale netwerkgegevens vertegenwoordigen de gegevensrecords individuele gebruikers; de attributen die ze beschrijven, zijn onder andere Leeftijd, postcode, relatiestatus, vriendenlijst, aantal vrienden, gewoonten, gebeurtenissen