Video: Software Testing Tutorials for Beginners 2024
De dataset die we analyseren om een voorspelling te maken, is de Seeds-dataset, die te vinden is in de UCI machine-learning repository. Deze dataset heeft 210 waarnemingen en 7 kenmerken plus het label. Het label is het verwachte resultaat en wordt gebruikt om de nauwkeurigheid van het voorspellingsmodel te trainen en evalueren.
Het resultaat dat u probeert te voorspellen, is het type zaad dat het is (kenmerk 8), gegeven de waarden van de zeven kenmerken. De drie mogelijke waarden voor het zaadtype zijn gelabeld 1, 2 en 3 en vertegenwoordigen de Kama, Rosa en Canadese tarwevariëteiten.
De kenmerken in de kolomvolgorde waarin ze worden aangeboden:
-
oppervlakte
-
perimeter
-
compactheid
-
lengte van kernel
-
breedte van kernel
-
asymmetriecoëfficiënt > lengte van kernelgroef
-
klasse van tarwe
-
Typ de volgende opdracht in de console:
U ziet dat de dataset is in het geheugen geladen als de dataframegroottezaden,
door naar je werkruimtepaneel te kijken (de rechterbovenhoek) Klik op de seeds -variabele om de gegevenswaarden in de bron te bekijken deelvenster (linksboven). Zo zien de gegevens eruit in het bronvenster.