Huis Persoonlijke financiën Hoe het Markov-model te gebruiken in Predictive Analytics - dummies

Hoe het Markov-model te gebruiken in Predictive Analytics - dummies

Video: The Bayesian Trap 2024

Video: The Bayesian Trap 2024
Anonim

Het Markov-model is een statistisch model dat kan worden gebruikt in voorspellende analyses die sterk afhankelijk zijn van de waarschijnlijkheidstheorie. (Het is genoemd naar een Russische wiskundige wiens primaire onderzoek was in de kansrekening.)

Dit is een praktisch scenario dat illustreert hoe het werkt: stel je voor dat je wilt voorspellen of Team X het spel van morgen zal winnen. Het eerste dat u moet doen, is het verzamelen van eerdere statistieken over Team X. De vraag die kan rijzen, is hoe ver terug u in de geschiedenis zou moeten gaan?

Laten we aannemen dat je achter elkaar de laatste 10 game-uitkomsten in het verleden hebt bereikt. Je wilt weten hoe waarschijnlijk het is dat Team X de volgende game wint, gezien de uitkomsten van de afgelopen 10 wedstrijden.

Het probleem is dat hoe verder je in de geschiedenis wilt gaan, hoe moeilijker en gecompliceerder de gegevensverzameling en kansberekening worden.

Geloof het of niet, het Markov-model vereenvoudigt je leven door je de Markov-veronderstelling te geven, die er zo uitziet als je het in woorden op schrift schrijft:

De kans dat een gebeurtenis zal plaatsvinden, gegeven n gebeurtenissen in het verleden, is ongeveer gelijk aan de waarschijnlijkheid dat een dergelijke gebeurtenis zal plaatsvinden, alleen gezien de laatste gebeurtenis uit het verleden.

Geschreven als een formule, ziet de Markov veronderstelling er als volgt uit:

Hoe dan ook, de Markov veronderstelling betekent dat je niet te ver terug in de geschiedenis hoeft te gaan om de uitkomst van morgen te voorspellen. U kunt gewoon de meest recente gebeurtenis uit het verleden gebruiken. Dit wordt de <1 eerste orde Markov-voorspelling genoemd omdat u alleen de laatste gebeurtenis overweegt om de toekomstige gebeurtenis te voorspellen.

A tweede orde Markov-voorspelling bevat alleen de laatste twee gebeurtenissen die opeenvolgend plaatsvinden. Uit de zojuist gegeven vergelijking kan de volgende veel gebruikte vergelijking ook worden afgeleid: Deze vergelijking is bedoeld om de waarschijnlijkheid te berekenen dat sommige gebeurtenissen in volgorde zullen plaatsvinden:

gebeurtenis 1 na gebeurtenis 2 , enzovoort. Deze kans kan worden berekend door de waarschijnlijkheid van elke gebeurtenis t te vermenigvuldigen met de volgende gebeurtenis in de reeks (gegeven de daaraan voorafgaande gebeurtenis). Stel dat je de waarschijnlijkheid wilt voorspellen dat Team X wint, verliest en vervolgens verliest. Hier ziet u hoe een typisch voorspellend model op basis van een Markov-model zou werken. Overweeg hetzelfde voorbeeld: stel dat je de resultaten wilt voorspellen van een voetbalwedstrijd die door Team X wordt gespeeld. De drie mogelijke uitkomsten -

-statussen genoemd - zijn winst, verlies of gelijkspel. Stel dat je statistische gegevens uit het verleden hebt verzameld over de resultaten van voetbalwedstrijden van Team X en dat Team X zijn meest recente game verloor. Je wilt het resultaat van de volgende voetbalwedstrijd voorspellen. Het gaat erom te raden of Team X zal winnen, verliezen of gelijkspel - alleen op basis van gegevens uit eerdere games. Dus hier is hoe je een Markov-model gebruikt om die voorspelling te maken.

Bereken enkele kansen op basis van gegevens uit het verleden.

  1. Hoe vaak heeft Team X bijvoorbeeld games verloren? Hoe vaak heeft Team X wedstrijden gewonnen? Stel je bijvoorbeeld eens voor dat Team X in totaal zes van de tien spellen heeft gewonnen. Vervolgens heeft Team X 60 procent van de tijd gewonnen. Met andere woorden, de kans op winnen voor Team X is 60 procent.

    Bereken de kans op een verlies en dan de kans op gelijkspel, op dezelfde manier.

  2. Gebruik de Naïve Bayes-waarschijnlijkheidsvergelijking om waarschijnlijkheden te berekenen, zoals de volgende:

  3. De kans dat Team X wint, aangezien Team X de laatste game heeft verloren.

    • De kans dat Team X verliest, aangezien Team X de laatste game heeft gewonnen.

    • Bereken de kansen voor elke staat (winst, verlies of gelijkspel).

  4. Ervan uitgaande dat het team slechts één spel per dag speelt, zijn de kansen als volgt:

  5. P (Win | Loss) is de kans dat Team X vandaag zal winnen, gezien het feit dat het gisteren verloor.

    • P (Win | Tie) is de kans dat Team X vandaag wint, aangezien het gisteren vastliep.

    • P (Win | Win) is de kans dat Team X vandaag zal winnen, gezien het gisteren won.

    • Maak met behulp van de berekende kansen een diagram.

  6. Een cirkel in dit diagram geeft een mogelijke status weer die Team X op een bepaald moment kon behalen (winst, verlies, gelijkspel); de cijfers op de pijlen geven de kansen weer dat Team X van de ene staat naar de andere kan gaan.

    Als Team X bijvoorbeeld net de wedstrijd van vandaag heeft gewonnen (de huidige status = overwinning), is de kans dat het team opnieuw wint 60 procent; de kans dat ze het volgende spel verliezen is 20 procent (in welk geval ze van huidige status = winnen naar toekomstige status = verlies).

Stel dat je de kans wilt weten dat Team X twee wedstrijden op rij wint en de derde verliest. Zoals je je misschien kunt voorstellen, is dat geen eenvoudige voorspelling.

Door de zojuist gemaakte grafiek en de Markov-aanname te gebruiken, kunt u eenvoudig de kansen voorspellen dat een dergelijke gebeurtenis zich voordoet. Je begint met de win-status, loopt opnieuw door de win-state en neemt 60 procent op; dan ga je naar de verliesstatus en registreer je 20 procent.

De kans dat Team X twee keer wint en de derde game verliest, wordt eenvoudig te berekenen: 60 procent keer 60 procent keer 20 procent, wat 60 procent * 60 procent * 20 procent is, of 72 procent.

Dus hoe groot is de kans dat Team X zal winnen, dan gelijkspel en daarna tweemaal verliest? Het antwoord is 20 procent (overgang van winstaat naar gelijkspel) maal 20 procent (overgang van gelijkspel naar verlies), keer 35 procent (overgang van verlies naar verlies) maal 35 procent (verplaatsing van verlies naar verlies). Het resultaat is 49 procent.

Hoe het Markov-model te gebruiken in Predictive Analytics - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...