Video: What’s next for IoT? Artificial Intelligence, of course | The Element Podcast - E07 2024
Een deel van Predictive Analytics voor Dummy's Cheat Sheet
Een succesvol voorspellend analyseproject wordt stap voor stap uitgevoerd. Terwijl u zich verdiept in de details van het project, let dan op deze belangrijke mijlpalen:
-
Bedrijfsdoelstellingen definiëren
Het project begint met het gebruik van een duidelijk omschreven bedrijfsdoelstelling. Het model moet een zakelijke vraag behandelen. Als u duidelijk aangeeft dat dit het doel is, kunt u de reikwijdte van uw project definiëren en krijgt u de exacte test om het succes ervan te meten.
-
Gegevens voorbereiden
U gebruikt historische gegevens om uw model te trainen. De gegevens zijn meestal verspreid over meerdere bronnen en kunnen mogelijk worden gereinigd en voorbereid. Gegevens kunnen dubbele records en uitschieters bevatten; afhankelijk van de analyse en het zakelijke doel, beslist u of u ze wilt behouden of verwijderen. De gegevens kunnen ook ontbrekende waarden bevatten, moeten mogelijk enige transformatie ondergaan en kunnen worden gebruikt om afgeleide kenmerken te genereren die meer voorspellende kracht hebben voor uw doel. Over het algemeen geeft de kwaliteit van de gegevens de kwaliteit van het model aan.
-
Sampling uw gegevens
U moet uw gegevens in twee sets splitsen: training en test datasets. U bouwt het model met behulp van de trainingsgegevensset. U gebruikt de testgegevensset om de nauwkeurigheid van de uitvoer van het model te controleren. Dit is absoluut cruciaal. Anders loop je het risico dat je model wordt overbelast - door het model te trainen met een beperkte dataset, tot het punt dat het alle kenmerken (zowel het signaal als de ruis) kiest die alleen gelden voor die specifieke dataset. Een model dat is overbevestigd voor een specifieke gegevensverzameling presteert ellendig wanneer u het uitvoert op andere gegevenssets. Een testgegevensset zorgt voor een geldige manier om de prestaties van uw model nauwkeurig te meten.
-
Het model bouwen
Soms lenen de gegevens of bedrijfsdoelstellingen zich voor een specifiek algoritme of model. Andere keren is de beste aanpak niet zo duidelijk. Terwijl u de gegevens verkent, voert u zoveel algoritmen uit als u kunt; vergelijk hun outputs. Baseer uw keuze van het definitieve model op de algemene resultaten. Soms kun je beter een ensemble van modellen tegelijkertijd op de data laten draaien en een eindmodel kiezen door hun outputs te vergelijken.
-
Het model implementeren
Nadat u het model hebt gebouwd, moet u het implementeren om de voordelen ervan te benutten. Dat proces kan coördinatie met andere afdelingen vereisen. Streven naar het bouwen van een inzetbaar model. Zorg er ook voor dat u weet hoe u uw resultaten op een begrijpelijke en overtuigende manier kunt presenteren aan de zakelijke belanghebbenden, zodat zij uw model overnemen.Nadat het model is geïmplementeerd, moet u de prestaties ervan controleren en blijven verbeteren. De meeste modellen vervallen na een bepaalde periode. Houd je model up-to-date door het te vernieuwen met nieuw beschikbare gegevens.