Huis Persoonlijke financiën Fase 4 van het CRISP-DM-procesmodel: modelleren - dummies

Fase 4 van het CRISP-DM-procesmodel: modelleren - dummies

Inhoudsopgave:

Video: ¡TODAS las Revelaciones sobre los ETERNALS en la CCXP! – Marvel Fase 4 2020 - 2024

Video: ¡TODAS las Revelaciones sobre los ETERNALS en la CCXP! – Marvel Fase 4 2020 - 2024
Anonim

Modelleren is het onderdeel van het proces voor cross-industriestandaardproces voor datamining (CRISP-DM) dat de meeste gegevens bevatten mijnwerkers als de beste. Uw gegevens zijn al in goede vorm en u kunt nu zoeken naar nuttige patronen in uw gegevens.

De modelleringsfase omvat vier taken. Dit zijn

  • Modelleertechnieken selecteren

  • Ontwerptest (en)

  • Bouwmodel (len)

  • Model (s) beoordelen

Taak: modelleringstechnieken selecteren

De wondere wereld van datamining biedt een hoop modelleringstechnieken, maar niet alle zullen aan uw behoeften voldoen. Beperk de lijst op basis van de soorten variabelen die hierbij zijn betrokken, de selectie van beschikbare technieken in uw hulpmiddelen en eventuele zakelijke overwegingen die voor u van belang zijn.

Bijvoorbeeld, veel organisaties geven de voorkeur aan methoden met uitvoer die gemakkelijk te interpreteren is, dus beslissingsbomen of logistische regressie kunnen acceptabel zijn, maar neurale netwerken worden waarschijnlijk niet geaccepteerd.

Tot de deliverables voor deze taak behoren twee rapporten:

  • Modelleringstechniek: Specificeer de techniek (en) die u gaat gebruiken.

  • Aannames bij het modelleren: Veel modelleertechnieken zijn gebaseerd op bepaalde aannames. Een modeltype kan bijvoorbeeld zijn bedoeld voor gebruik met gegevens met een specifiek type distributie. Documenteer deze aannames in dit rapport.

Statistici zijn goed geïnformeerd, streng en kieskeurig over aannames. Dat is niet noodzakelijk waar voor mijnwerkers en het is geen vereiste om een ​​dataminer te worden. Als u diepgaande statistische kennis hebt en de aannames achter de modellen die u selecteert begrijpt, kunt u streng en kieskeurig zijn over aannames.

Maar veel gegevensmijnen, vooral beginnende mijnwerkers, maken zich niet druk over aannames. Het alternatief is testen - heel veel testen - van uw modellen.

Taak: ontwerpen van tests

De test in deze taak is de test die u zult gebruiken om te bepalen hoe goed uw model werkt. Het kan zo simpel zijn als het splitsen van uw gegevens in een groep cases voor modeltraining en een andere groep voor het testen van modellen.

Trainingsgegevens worden gebruikt om wiskundige vormen aan te passen aan het gegevensmodel en testgegevens worden tijdens het modeltrainingproces gebruikt om overfitting te voorkomen: een model maken dat perfect is voor één gegevensset, maar geen ander. U kunt ook holdout-gegevens, gegevens die niet worden gebruikt tijdens het modeltrainingsproces, gebruiken voor een aanvullende test.

Het resultaat voor deze taak is uw testontwerp. Het hoeft niet uitgebreid te zijn, maar je moet er op zijn minst voor zorgen dat je trainings- en testgegevens vergelijkbaar zijn en dat je geen vertekening in de gegevens introduceert.

Taak: Bouwmodel (len)

Modelleren is wat veel mensen zich voorstellen als de hele klus van de dataminer, maar het is maar een taak van tientallen! Desondanks vormt modellering om specifieke bedrijfsdoelen aan te pakken de kern van het datamining-beroep.

Tot de deliverables voor deze taak behoren drie items:

  • Parameterinstellingen: Bij het bouwen van modellen bieden de meeste hulpprogramma's de mogelijkheid om verschillende instellingen aan te passen, en deze instellingen hebben invloed op de structuur van het uiteindelijke model. Documenteer deze instellingen in een rapport.

  • Modelbeschrijvingen: Beschrijf uw modellen. Vermeld het type model (zoals lineaire regressie of neuraal netwerk) en de gebruikte variabelen. Leg uit hoe het model wordt geïnterpreteerd. Document alle moeilijkheden die zich voordoen in het modelleringsproces.

  • Modellen: Dit resultaat zijn de modellen zelf. Sommige modeltypes kunnen eenvoudig worden gedefinieerd met een eenvoudige vergelijking; andere zijn veel te complex en moeten in een meer geavanceerd formaat worden overgedragen.

Taak: model (len) beoordelen

Nu bekijkt u de modellen die u hebt gemaakt, zowel vanuit technisch oogpunt als vanuit zakelijk oogpunt (vaak met inbreng van bedrijfsexperts in uw projectteam).

Te leveren resultaten voor deze taak zijn twee rapporten:

  • Modelbeoordeling: Geeft een overzicht van de informatie die is ontwikkeld in uw modelbeoordeling. Als u verschillende modellen hebt gemaakt, kunt u deze rangschikken op basis van uw beoordeling van de waarde voor een specifieke toepassing.

  • Herziene parameterinstellingen: U kunt ervoor kiezen de instellingen aan te passen die zijn gebruikt om het model te bouwen en een andere modelleermethode uit te voeren en uw resultaten te verbeteren.

Datamining, zoals een ui, een Dobos-torte of een sedimentair gesteente, heeft veel lagen. Wanneer u net begint met datamining, kunt u beginnen met het achterlaten van de parameterinstellingen op hun standaardwaarden (in feite ziet u misschien zelfs geen opties tenzij u moeite doet om ze te zoeken).

Naarmate u zich meer op uw gemak voelt in uw nieuwe dataminingcarrière, is het logisch dat u meer te weten komt over modelparameters en weet hoe u ze kunt gebruiken. Uw opties zullen sterk variëren met het type model en de specifieke tool die u gebruikt.

Fase 4 van het CRISP-DM-procesmodel: modelleren - dummies

Bewerkers keuze

Tien Helpbronnen voor Junos OS - dummies

Tien Helpbronnen voor Junos OS - dummies

Dit is een top-tien lijst met bronnen die u moet zoeken meer informatie over softwarebewerkingen, training en ondersteuning voor Junos - alle extra details die u mogelijk nodig heeft om Junos OS te kunnen configureren en bedienen in uw eigen netwerkimplementaties. CLI Help-commando's Bent u op zoek naar meer achtergrondinformatie over hoe een bepaalde functie ...

De functie van de drie vlakken van Junos netwerk OS - dummies

De functie van de drie vlakken van Junos netwerk OS - dummies

De architectuur van de Junos opererende systeem verdeelt de functies van besturing, services en doorsturen op verschillende niveaus. Elk van de vlakken van Junos OS biedt een kritieke set van functionaliteit in de werking van het netwerk. Besturingsvlak van het Junos-netwerkbesturingssysteem (NOS) Alle functies van het besturingsvlak lopen op ...

De basisprincipes van BGP-routebealing - dummy's

De basisprincipes van BGP-routebealing - dummy's

Het configureren van Border Gateway Protocol (BGP) kan nogal lastig zijn, vooral met grote aantallen peersessies die handmatig moeten worden geconfigureerd. In feite kan in een groot netwerk de full-mesh-vereiste voor IBGP een provisioning-nachtmerrie zijn. BGP's antwoord op de IBGP-paring-configuratie-nachtmerrie die het volledige maaswerk is, wordt routeberefening genoemd. Route ...

Bewerkers keuze

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Als de allerbeste locatie op het web staat op de pagina een van de zoekmachines, je moet de SEO-elementen kennen die je daar kunnen brengen. Een goede plek om te beginnen is met zoekwoorden. Zoekmachines gebruiken geavanceerde processen om zoekwoordgebruik en andere factoren te categoriseren en analyseren om erachter te komen ...

Persberichten als bron van SEO-inhoud - dummies

Persberichten als bron van SEO-inhoud - dummies

Het leuke aan persberichten is dat u ze zonder toestemming op uw website kunt gebruiken, en sommige zullen al voor de zoekmachine zijn geoptimaliseerd. Het doel van een persbericht is om het uit te sturen en te zien wie het ophaalt. U hoeft geen contact op te nemen met de eigenaar van het persbericht, omdat ...

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Zelfs de domeinnaam van uw site moet geoptimaliseerd voor zoekmachines. Zoekmachines lezen uniforme resource locators (URL's), op zoek naar sleutelwoorden erin. Bijvoorbeeld als u een website heeft met de domeinnaam knaagdierracen. com en iemand zoekt Google op knaagdierenraces, Google ziet rodent-racing als een wedstrijd; omdat er een streepje verschijnt tussen de twee ...

Bewerkers keuze

Praxis Elementair onderwijs Examen-Economie - dummies

Praxis Elementair onderwijs Examen-Economie - dummies

U zult enkele basisconcepten van de economie voor de Praxis moeten kennen Elementair onderwijs examen. Elementaire economie onderzoekt de wens voor, de productie van en de verkoop en het gebruik van geld, zowel lokaal als wereldwijd. Het onderwijzen van economie omvat concepten zoals behoeften versus behoeften, kosten en meer tot nadenken stemmende onderwerpen, zoals de volgende: ...

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Het Praxis basisonderwijs: Curriculum, instructie en beoordeling examen (5017) bestrijkt een breed scala van wat u moet weten over basisonderwijs. Als u het Praxis Elementary Education: Content Knowledge-examen (5018) neemt, moet u zich ervan bewust zijn dat het de dekking beperkt tot de inhoud van de vier hoofdonderwerpen die een elementaire leraar is ...

Praxis Core For Dummies Cheat Sheet - dummies

Praxis Core For Dummies Cheat Sheet - dummies

Voordat je te opgewonden raakt, begrijp dat de informatie die volgt niet klopt eigenlijk niet over het bedriegen van de Praxis. Het gaat echt meer om de meest efficiënte manieren om je voor te bereiden op het examen. Maar "voorbereidingsblad" heeft niet helemaal dezelfde reden. Trouwens, vals spelen is niet nodig als je weet wat je aan het doen bent, en ...