Inhoudsopgave:
Video: De 7 meest gemaakte fouten op een freesmachine 2024
Begeleid leren
- Niet-gesuperviseerd leren
- Versterking leren
- Begeleid leren
Begeleid leren
treedt op wanneer een algoritme leert van een voorbeeld gegevens en bijbehorende doelantwoorden die kunnen bestaan uit numerieke waarden of tekenreekslabels, zoals klassen of tags, om later de juiste reactie te voorspellen wanneer deze wordt gesteld met nieuwe voorbeelden. De begeleide aanpak is inderdaad vergelijkbaar met menselijk leren onder supervisie van een leraar. De docent biedt goede voorbeelden voor de student om te onthouden en de student ontleent dan algemene regels aan deze specifieke voorbeelden.
Niet-gesuperviseerd leren
treedt op wanneer een algoritme leert van eenvoudige voorbeelden zonder enige bijbehorende respons, en aan het algoritme overlaat om zelf de gegevenspatronen te bepalen. Dit type algoritme heeft de neiging de gegevens te herstructureren in iets anders, zoals nieuwe functies die een klasse of een nieuwe reeks niet-gecorreleerde waarden kunnen vertegenwoordigen. Ze zijn heel nuttig om mensen inzichten te geven in de betekenis van gegevens en nieuwe bruikbare inputs voor machinegeleed algoritmen onder toezicht.
Het algoritme voor marketingautomatisering ontleent zijn suggesties aan wat u in het verleden hebt gekocht. De aanbevelingen zijn gebaseerd op een schatting van welke groep klanten u het meest lijkt en leiden vervolgens uw waarschijnlijke voorkeuren af op basis van die groep.
Wapeningsleer
Wapeningsversterking
treedt op wanneer u het algoritme presenteert met voorbeelden die geen labels hebben, zoals bij onbewaakt leren. U kunt een voorbeeld echter vergezeld laten gaan van positieve of negatieve feedback op basis van de oplossing die het algoritme voorstelt.Reinforcement learning is verbonden met applicaties waarvoor het algoritme beslissingen moet nemen (dus het product is prescriptief, niet alleen beschrijvend, zoals bij onbewaakt leren), en de beslissingen hebben consequenties. In de menselijke wereld is het net als met vallen en opstaan leren. Fouten helpen je te leren omdat er een boete aan is toegevoegd (kosten, tijdverlies, spijt, pijn, enzovoort), omdat je wordt geleerd dat een bepaalde manier van werken minder kans van slagen heeft dan andere. Een interessant voorbeeld van versterkingsleren is dat computers leren om zelf videogames te spelen.
In dit geval geeft een toepassing het algoritme voorbeelden van specifieke situaties, zoals de gamer laten vastlopen in een doolhof terwijl een vijand wordt vermeden. De applicatie laat het algoritme de uitkomst kennen van de acties die het uitvoert, en het leren gebeurt terwijl het probeert te vermijden wat het ontdekt als gevaarlijk en om te overleven na te streven. Bekijk hoe het bedrijf Google DeepMind een versterkingsleren-programma heeft gemaakt dat oude videogames van Atari speelt. Let bij het bekijken van de video op hoe onhandig het programma is, maar verbetert gestaag met trainen tot het een kampioen wordt.