Video: How to write a TEST CASE? Software Testing Tutorial 2024
Wanneer je gegevens gereed zijn en je op het punt staat om je voorspellingsmodel voor analyse te bouwen, is het handig om je testmethode te beschrijven en een testplan op te stellen. Testen moet worden gestuurd door de bedrijfsdoelen die u hebt verzameld, gedocumenteerd en alle benodigde gegevens hebt verzameld om u te helpen bereiken.
Je moet meteen een methode bedenken om te testen of een zakelijk doel met succes is bereikt. Omdat voorspellende analyses de waarschijnlijkheid van een toekomstige uitkomst meten, en de enige manier om klaar te zijn om zo'n test uit te voeren, is door uw model te trainen op gegevens uit het verleden, moet u nog steeds zien wat het kan doen als het in tegenspraak is met toekomstige gegevens.
Je kunt natuurlijk niet riskeren om een niet-beproefd model op echte toekomstige gegevens te gebruiken, dus je zult bestaande gegevens moeten gebruiken om toekomstige gegevens realistisch te simuleren. Om dit te doen, moet u de gegevens waaraan u werkt splitsen in gegevenssets voor training en testen.
Zorg ervoor dat u deze twee gegevenssets willekeurig selecteert en dat beide gegevenssets alle gegevensparameters bevatten die u meet.
Wanneer u uw gegevens opsplitst in test- en trainingsgegevenssets, voorkomt u effectief overcompartimenten die kunnen ontstaan door overtraining van het model in de gehele gegevensset en het opnemen van alle ruispatronen of specifieke functies die alleen bij de voorbeeldgegevensset horen en zijn niet van toepassing op andere datasets.
Het scheiden van uw gegevens in trainings- en testgegevenssets, ongeveer 70 procent en 30 procent, zorgt voor een nauwkeurige meting van de prestaties van het model met voorspellende analyse dat u aan het bouwen bent. U wilt uw model vergelijken met de testgegevens, omdat het een eenvoudige manier is om te meten of de voorspellingen van het model juist zijn.