Huis Persoonlijke financiën Wat Data Miners doen - dummies

Wat Data Miners doen - dummies

Inhoudsopgave:

Video: #FixCopyright: Copyright & Research - Text & Data Mining (TDM) Explained 2024

Video: #FixCopyright: Copyright & Research - Text & Data Mining (TDM) Explained 2024
Anonim

Als je data ziet als grondstof, en de informatie die je kunt krijgen van data als iets waardevols en relatief verfijnd, kan het proces van het extraheren van informatie vergeleken met het extraheren van metaal uit erts of edelstenen uit vuil. Zo ontstond de term datamining .

Concentreren op datamining

Datamijnwerkers overdenken niet alleen gegevens doelloos, in de hoop iets interessants te vinden. Elk datamining-project begint met een specifiek bedrijfsprobleem en een doel om te matchen.

Als dataminer heb je waarschijnlijk niet de autoriteit om definitieve zakelijke beslissingen te nemen, dus het is belangrijk dat je je werk afstemt op de behoeften van beleidsmakers. U moet hun problemen, behoeften en voorkeuren begrijpen en uw inspanningen richten op het verstrekken van informatie die goede zakelijke beslissingen ondersteunt.

Uw eigen bedrijfskennis is erg belangrijk. Leidinggevenden gaan niet naast je zitten terwijl je werkt, feedback geven over de relevantie van je ontdekkingen voor hun zorgen. Je moet je eigen ervaring en scherpzinnigheid gebruiken om dat voor jezelf te beoordelen terwijl je werkt.

Begrijpen hoe gegevens mijnwerkers hun tijd besteden

Het zou geweldig zijn als gegevens mijnwerkers de hele dag konden doorbrengen om levensveranderende ontdekkingen te doen, waardevolle modellen te bouwen en ze te integreren in het dagelijks leven. Maar dat is hetzelfde als zeggen dat het geweldig zou zijn als atleten de hele dag door winnende toernooien zouden kunnen doorbrengen. Het kost veel voorbereiding om op te bouwen tot die momenten van triomf. Dus, zoals atleten, besteden mijnwerkers veel tijd aan voorbereiding.

Kennismaken met het dataminingproces

Een goed werkproces helpt u om optimaal gebruik te maken van uw tijd, uw gegevens en al uw andere bronnen. In dit boek ontdekt u het meest populaire dataminingproces, CRISP-DM. Het is een cyclus van zes fasen van ontdekking en actie die is gecreëerd door een consortium van gegevensmineranten uit vele industrieën en een open standaard die iedereen mag gebruiken.

De fasen van het CRISP-DM-proces zijn

  1. Business Understanding

  2. Data Understanding

  3. Data Preparation

  4. Modelling

  5. Evaluation

  6. Deployment (met behulp van modellen in de dagelijkse business)

Elke fase heeft evenveel gewicht als belangrijk voor de kwaliteit van de resultaten en waarde voor het bedrijf. Maar in termen van de benodigde tijd domineert datapreparatie. De voorbereiding van de gegevens kost doorgaans meer tijd dan alle andere fasen van het dataminingproces gecombineerd.

Modellen maken

Wanneer de doelen worden begrepen en de gegevens worden opgeruimd en klaar voor gebruik, kunt u uw aandacht richten op het bouwen van voorspellende modellen.Modellen doen wat rapporten niet kunnen; ze geven je informatie die actie ondersteunt.

Een rapport kan u vertellen dat de verkopen laag zijn. Het kan de omzet per regio, product en kanaal onderbreken, zodat u weet waar de verkoop daalde en of deze dalingen wijdverspreid waren of alleen bepaalde gebieden beïnvloedden. Maar ze geven u geen aanwijzingen over waarom de verkoop daalde of welke acties zouden kunnen helpen om het bedrijf nieuw leven in te blazen. Modellen helpen u inzicht te krijgen in de factoren die van invloed zijn op de verkoop, de acties die de neiging hebben de verkoop te verhogen of te verlagen, en de strategieën en tactieken die ervoor zorgen dat uw bedrijf soepel blijft draaien. Dat is opwindend, toch? Misschien is het daarom dat de meeste dataliefers modelleren beschouwen als het leuke deel van de klus.

Mathematische modellen begrijpen

Wiskundige modellen staan ​​centraal in datamining, maar wat zijn ze? Wat doen ze, hoe werken ze en hoe worden ze gemaakt?

Een wiskundig model is, eenvoudig en duidelijk, een vergelijking, of een reeks vergelijkingen, die een relatie tussen twee of meer dingen beschrijven. Dergelijke vergelijkingen zijn stenografisch voor theorieën over de werking van de natuur en de samenleving. De theorie kan worden ondersteund door een substantieel aantal bewijzen, of het kan een wilde gok zijn. De taal van de wiskunde is in beide gevallen hetzelfde.

Termen als

voorspellend model, statistisch model, of lineair model verwijzen naar specifieke typen wiskundige modellen, de namen die het beoogde gebruik, de vorm of de methode van afleiding weerspiegelen een bepaald model. Deze drie voorbeelden zijn slechts enkele van vele van dergelijke termen. Wanneer een model wordt genoemd in een zakelijke omgeving, is dit waarschijnlijk een model dat wordt gebruikt om voorspellingen te doen. Modellen worden gebruikt om aandelenkoersen, productverkopen en werkloosheidspercentages te voorspellen, naast vele andere dingen.

Deze voorspellingen kunnen al dan niet nauwkeurig zijn, maar voor elke gegeven reeks waarden (bekende factoren zoals deze heten

onafhankelijke variabelen of ingangen ) die in het model zijn opgenomen, zult u een goed gedefinieerde voorspelling vinden (ook een afhankelijke variabele, uitvoer, of resultaat ). Wiskundige modellen worden ook voor andere doeleinden in het bedrijfsleven gebruikt, bijvoorbeeld om de werkingsmechanismen te beschrijven die een bepaald proces sturen. In datamining maakt u modellen door patronen in gegevens te vinden met behulp van machine learning of statistische methoden. Mijnwerkers volgen niet dezelfde rigoureuze aanpak als klassieke statistici, maar alle modellen zijn afgeleid van feitelijke gegevens en consistente wiskundige modelleringstechnieken. Alle datamining-modellen worden ondersteund door een hoeveelheid bewijsmateriaal.

Waarom wiskundige modellen gebruiken? Kunnen dezelfde relaties niet worden beschreven met woorden? Dat is mogelijk, maar toch vind je bepaalde voordelen bij het gebruik van vergelijkingen. Deze omvatten

Gemak:

  • Vergeleken met equivalente beschrijvingen uitgeschreven in zinnen, zijn vergelijkingen kort. Wiskundige symboliek is specifiek ontwikkeld met het doel wiskundige relaties te representeren; talen zoals Engels zijn dat niet. Duidelijkheid:

  • Vergelijkingen geven ideeën bondig en zijn ondubbelzinnig.Ze zijn niet onderworpen aan verschillende interpretaties op basis van cultuur, en de symboliek van de wiskunde is een soort gemeenschappelijke taal die overal ter wereld wordt gebruikt. Consistentie:

  • Omdat wiskundige representaties ondubbelzinnig zijn, worden de implicaties van een bepaalde situatie duidelijk gedefinieerd door een wiskundig model. Informatie in actie brengen

Een model levert alleen waarde op als u het in het bedrijf gebruikt. De voorspellingen van een model kunnen de besluitvorming op verschillende manieren ondersteunen. U kunt

voorspellingen opnemen in een rapport of presentatie om te gebruiken bij het nemen van een specifieke beslissing.

  • Integreer het model in een operationeel systeem (zoals een klantenservicesysteem) om real-time voorspellingen te doen voor dagelijks gebruik. (U kunt bijvoorbeeld verzekeringsclaims indienen voor onmiddellijke betaling, onmiddellijke weigering of verder onderzoek.)

  • Gebruik het model voor batchvoorspellingen. (U kunt bijvoorbeeld de interne klantenlijst scoren om te beslissen welke klanten een bepaalde aanbieding moeten ontvangen.)

Wat Data Miners doen - dummies

Bewerkers keuze

Tien Helpbronnen voor Junos OS - dummies

Tien Helpbronnen voor Junos OS - dummies

Dit is een top-tien lijst met bronnen die u moet zoeken meer informatie over softwarebewerkingen, training en ondersteuning voor Junos - alle extra details die u mogelijk nodig heeft om Junos OS te kunnen configureren en bedienen in uw eigen netwerkimplementaties. CLI Help-commando's Bent u op zoek naar meer achtergrondinformatie over hoe een bepaalde functie ...

De functie van de drie vlakken van Junos netwerk OS - dummies

De functie van de drie vlakken van Junos netwerk OS - dummies

De architectuur van de Junos opererende systeem verdeelt de functies van besturing, services en doorsturen op verschillende niveaus. Elk van de vlakken van Junos OS biedt een kritieke set van functionaliteit in de werking van het netwerk. Besturingsvlak van het Junos-netwerkbesturingssysteem (NOS) Alle functies van het besturingsvlak lopen op ...

De basisprincipes van BGP-routebealing - dummy's

De basisprincipes van BGP-routebealing - dummy's

Het configureren van Border Gateway Protocol (BGP) kan nogal lastig zijn, vooral met grote aantallen peersessies die handmatig moeten worden geconfigureerd. In feite kan in een groot netwerk de full-mesh-vereiste voor IBGP een provisioning-nachtmerrie zijn. BGP's antwoord op de IBGP-paring-configuratie-nachtmerrie die het volledige maaswerk is, wordt routeberefening genoemd. Route ...

Bewerkers keuze

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Als de allerbeste locatie op het web staat op de pagina een van de zoekmachines, je moet de SEO-elementen kennen die je daar kunnen brengen. Een goede plek om te beginnen is met zoekwoorden. Zoekmachines gebruiken geavanceerde processen om zoekwoordgebruik en andere factoren te categoriseren en analyseren om erachter te komen ...

Persberichten als bron van SEO-inhoud - dummies

Persberichten als bron van SEO-inhoud - dummies

Het leuke aan persberichten is dat u ze zonder toestemming op uw website kunt gebruiken, en sommige zullen al voor de zoekmachine zijn geoptimaliseerd. Het doel van een persbericht is om het uit te sturen en te zien wie het ophaalt. U hoeft geen contact op te nemen met de eigenaar van het persbericht, omdat ...

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Zelfs de domeinnaam van uw site moet geoptimaliseerd voor zoekmachines. Zoekmachines lezen uniforme resource locators (URL's), op zoek naar sleutelwoorden erin. Bijvoorbeeld als u een website heeft met de domeinnaam knaagdierracen. com en iemand zoekt Google op knaagdierenraces, Google ziet rodent-racing als een wedstrijd; omdat er een streepje verschijnt tussen de twee ...

Bewerkers keuze

Praxis Elementair onderwijs Examen-Economie - dummies

Praxis Elementair onderwijs Examen-Economie - dummies

U zult enkele basisconcepten van de economie voor de Praxis moeten kennen Elementair onderwijs examen. Elementaire economie onderzoekt de wens voor, de productie van en de verkoop en het gebruik van geld, zowel lokaal als wereldwijd. Het onderwijzen van economie omvat concepten zoals behoeften versus behoeften, kosten en meer tot nadenken stemmende onderwerpen, zoals de volgende: ...

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Het Praxis basisonderwijs: Curriculum, instructie en beoordeling examen (5017) bestrijkt een breed scala van wat u moet weten over basisonderwijs. Als u het Praxis Elementary Education: Content Knowledge-examen (5018) neemt, moet u zich ervan bewust zijn dat het de dekking beperkt tot de inhoud van de vier hoofdonderwerpen die een elementaire leraar is ...

Praxis Core For Dummies Cheat Sheet - dummies

Praxis Core For Dummies Cheat Sheet - dummies

Voordat je te opgewonden raakt, begrijp dat de informatie die volgt niet klopt eigenlijk niet over het bedriegen van de Praxis. Het gaat echt meer om de meest efficiënte manieren om je voor te bereiden op het examen. Maar "voorbereidingsblad" heeft niet helemaal dezelfde reden. Trouwens, vals spelen is niet nodig als je weet wat je aan het doen bent, en ...