Video: Words at War: Combined Operations / They Call It Pacific / The Last Days of Sevastopol 2024
gesuperviseerde analyses, beide invoer correct kan labelen en voorkeursuitvoer zijn onderdeel van de trainingsgegevens. Het voorspellende analysemodel krijgt de juiste resultaten als onderdeel van het leerproces. Zulke supervised learning veronderstelt vooraf geclassificeerde voorbeelden: het doel is om het model te laten leren van de eerder bekende classificatie, zodat het het volgende onbekende datapunt correct kan labelen op basis van wat het heeft geleerd.
Wanneer de training van het model voltooid is, wordt een mathematische functie afgeleid door de trainingsgegevens te bekijken. Die functie zal worden gebruikt om nieuwe gegevenspunten te labelen.
Om deze aanpak correct te laten werken, moeten de trainingsgegevens - samen met de testgegevens - zorgvuldig worden geselecteerd. Het getrainde model moet in staat zijn om het juiste label voor een nieuw gegevenspunt snel en precies te voorspellen op basis van het gegevenstype (n) dat het model in de trainingsgegevens heeft gezien.
Gecontroleerde analyses bieden enkele duidelijke voordelen:
-
De analist is verantwoordelijk voor het proces.
-
Labeling is gebaseerd op bekende classificaties.
-
Labelfouten kunnen eenvoudig worden opgelost.
De keerzijde van deze voordelen is een even verschillende reeks potentiële nadelen:
-
Fouten in de trainingsfase zullen later worden versterkt.
-
De classificatie van de analist beschrijft mogelijk niet de volledige populatie adequaat.
-
Het model kan mogelijk geen klassen detecteren die afwijken van de oorspronkelijke trainingsset.
-
De veronderstelling dat de clusters binnen de gegevens elkaar niet overlappen - en dat ze gemakkelijk van elkaar kunnen worden gescheiden - is mogelijk niet geldig.