Huis Persoonlijke financiën Analytics en gegevenswrangelen implementeren om onbewerkte gegevens om te zetten in uitvoerbare inzichten - dummies

Analytics en gegevenswrangelen implementeren om onbewerkte gegevens om te zetten in uitvoerbare inzichten - dummies

Inhoudsopgave:

Video: Christian Yelich: Defying analytics en route to an MVP season 2024

Video: Christian Yelich: Defying analytics en route to an MVP season 2024
Anonim

Uw onbewerkte gegevens omzetten in bruikbare informatie is de eerste stap in de voortgang van de gegevens die u heeft verzameld tot iets dat je echt ten goede komt. Bedrijfskundige gegevenswetenschappers gebruiken gegevensanalyse om inzichten uit onbewerkte gegevens te genereren.

De typen analyses identificeren

Hieronder worden, in volgorde van toenemende complexiteit, de vier typen gegevensanalyse weergegeven die u waarschijnlijk zult tegenkomen:

  • Beschrijvende analyse: Dit type analyse geeft antwoord op de vraag: "Wat is er gebeurd? "Beschrijvende analyses zijn gebaseerd op historische en actuele gegevens. Een bedrijfsanalist of een bedrijfsgerichte gegevenswetenschapper baseert moderne bedrijfsinformatie op beschrijvende analyses.

  • Diagnostische analyse: u gebruikt dit type analyse om antwoorden op de vraag te vinden: 'Waarom gebeurde er iets dergelijks? "Of" wat ging er mis? "Diagnostische analyses zijn handig voor het afleiden en afleiden van het succes of falen van subcomponenten van elk op gegevens gebaseerd initiatief.

  • Predictive analytics: Hoewel dit type analyse is gebaseerd op historische en huidige gegevens, gaan voorspellende analyses een stap verder dan beschrijvende analyses. Voorspellende analyses omvatten complexe modelopbouw en analyse om een ​​toekomstige gebeurtenis of trend te voorspellen. In een zakelijke context zouden deze analyses worden uitgevoerd door de bedrijfsgerichte gegevenswetenschapper.

  • Prescriptieve analyse: Dit type analyse is bedoeld om processen, structuren en systemen te optimaliseren door middel van geïnformeerde actie die is gebaseerd op voorspellende analyses - in essentie vertelt u wat u moet doen op basis van een gefundeerde schatting van wat er zal gebeuren. Zowel bedrijfsanalisten als bedrijfsgerichte gegevenswetenschappers kunnen prescriptieve analyses genereren, maar hun methoden en gegevensbronnen verschillen.

Idealiter zou een bedrijf zich moeten bezighouden met alle vier soorten gegevensanalyses, maar prescriptieve analyse is het meest directe en effectieve middel om waarde te genereren uit gegevensinzichten.

Identificatie van veelvoorkomende uitdagingen in Analytics

Analytics vormt in het algemeen een onderneming met minstens twee uitdagingen. Ten eerste hebben organisaties het vaak erg moeilijk om nieuwe medewerkers te vinden met specifieke vaardigheden die analytics bevatten. Ten tweede hebben zelfs ervaren analisten vaak moeite om complexe inzichten te communiceren op een manier die begrijpelijk is voor managementbeslissers.

Om deze uitdagingen te overwinnen, moet de organisatie een cultuur maken en onderhouden die analytische producten waardeert en accepteert. Het bedrijf moet werken om alle niveaus van de organisatie te onderwijzen, zodat het management een basisconcept voor analyse heeft en het succes dat kan worden behaald door deze te implementeren.

Omgekeerd moeten bedrijfsgerichte gegevenswetenschappers over een zeer solide kennis van zaken in het algemeen en in het bijzonder een goed begrip van het bedrijf beschikken. Een sterke bedrijfskennis is een van de drie belangrijkste vereisten van elke bedrijfsgerichte gegevenswetenschapper - de andere twee zijn een sterk codeerkennis en sterke kwantitatieve analysevaardigheden via wiskunde en statistische modellering.

Wrangelen van onbewerkte gegevens tot bruikbare inzichten

Gegevensstrijd is een ander belangrijk deel van het werk dat nodig is om gegevens om te zetten in inzichten. Als u analyses van onbewerkte gegevens wilt maken, moet u bijna altijd gegevensruzie gebruiken - de processen en procedures die u gebruikt om gegevens van het ene formaat en structuur naar het andere formaat te wissen en te converteren, zodat de gegevens nauwkeurig zijn en in de formaatanalysehulpmiddelen en -scripts die nodig zijn voor consumptie.

De volgende lijst belicht een paar van de praktijken en problemen die het meest relevant zijn voor data-ruzie:

  • Data-extractie: De business-centrische data scientist moet eerst vaststellen welke datasets relevant zijn voor het probleem en vervolgens voldoende hoeveelheden gegevens extraheren die nodig zijn om het probleem op te lossen. (Dit extractieproces wordt gewoonlijk data mining genoemd.)

  • Gegevens mungen: Gegevens mungen bestaat uit het opschonen van de ruwe gegevens die via data mining zijn geëxtraheerd en vervolgens worden geconverteerd naar een indeling die zorgt voor een gemakkelijker gebruik van de gegevens. (Mung begon het leven als een destructief proces, waarbij je iets herkenbaars omzet in iets dat onherkenbaar was, dus de uitdrukking Mash Until No Good of MUNG.)

  • Gegevensbeheer: Data governance-standaarden zijn standaarden die worden gebruikt als kwaliteitscontrolemaatregel om ervoor te zorgen dat handmatige en geautomatiseerde gegevensbronnen voldoen aan de datastandaarden van het betreffende model. Normen voor gegevensbeheer moeten worden toegepast, zodat de gegevens in de juiste korreligheid zijn wanneer deze worden opgeslagen en klaargemaakt voor gebruik.

    Granulariteit is een maat voor het detailniveau van een dataset. De granulariteit van gegevens wordt bepaald door de relatieve grootte van de subgroepen waarin de gegevens worden verdeeld.

  • Gegevensarchitectuur: IT-architectuur staat centraal. Als uw gegevens worden geïsoleerd in afzonderlijke, vaste opslagplaatsen - die beruchte gegevenssilo's waar iedereen over klaagt - dan is deze alleen beschikbaar voor een paar mensen binnen een bepaalde branche. In elkaar geschoven gegevensstructuren resulteren in scenario's waarbij een meerderheid van de gegevens van een organisatie eenvoudigweg niet beschikbaar is voor gebruik door de organisatie in het algemeen. (Het is onnodig om te zeggen dat siloconstructuren ongelooflijk verspillend en inefficiënt zijn.)

Als het uw doel is om de meeste waarde en inzicht te verkrijgen uit de bedrijfsgegevens van uw organisatie, moet u ervoor zorgen dat de gegevens worden opgeslagen in een centraal datawarehouse en niet in afzonderlijke silo's.

Analytics en gegevenswrangelen implementeren om onbewerkte gegevens om te zetten in uitvoerbare inzichten - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...