Video: How to make a Triangular Graph 2024
Datamijnwerkers maken vaak gebruik van speciale functies om meer informatie in eenvoudige grafieken in te pakken. Labels, overlays en interactieve selectie zijn kenmerken van datamining-toepassingen, speciale functies waarmee u productiever kunt werken.
Het aantal kilometers neemt af naarmate het aantal pk's toeneemt, zoals te zien is in de volgende afbeelding.
Kilometerstand neemt toe met de tijd, zoals je kunt zien, een scatterplot van kilometers versus modeljaar. Het zou handig zijn om deze twee ideeën in één grafiek te krijgen.
Veelgebruikte methoden voor het ontginnen van gegevens voor het integreren van meer dan twee variabelen in een grafiek zijn
-
Labels: Labels zijn waarden van een tekenreeks of categoriale variabele die op de scatterplot zijn toegevoegd. De volgende afbeelding toont een scatterplot gelabeld met het modeljaar van de auto.
Datasets met veel punten of lange labels kunnen deze grafieken onleesbaar maken! De oplossing is om alleen een steekproef van de gegevens te gebruiken. De instellingen voor dit soort bemonstering worden in de volgende afbeelding getoond.
-
Overlays: Met overlays definiëren waarden van een categorische variabele de vorm of kleur van de punten. De volgende afbeelding toont de setup voor een scatterplot om het modeljaar op de scatterplot met mijlen versus pk uit te leggen.
De geëxporteerde overlay-spreidingsplattegrond verschijnt in de volgende afbeelding. Het is misschien gemakkelijker om kleuroverlays te lezen dan overlays met puntvormen. De setup is meestal vrijwel hetzelfde.
Een ander ding om in gedachten te houden met scatterplots: misschien heb je meerdere punten op dezelfde plek! Als dat het geval is, kunt u een punt voor één geval mogelijk niet voor 100 gevallen uit een punt onderscheiden. De remedie is om te controleren of er een optie is om meerdere instanties zichtbaar te maken. Zoek naar puntgrootte of jitter (verplaatst punten enigszins van hun ware locaties om ze allemaal zichtbaar te maken).
Interactieve scatterplots zijn geweldige tijdbesparende functies voor gegevensmijnen.
Stel dat u een interessante groep cases in een grafiek ziet en dat u alleen die gevallen verder wilt onderzoeken. Als je slechts één of twee punten bekijkt, kun je de informatie die je wilt krijgen door zweven, maar dat is niet bevredigend als je meer dan een paar punten interessant vindt.
Tools voor gegevensselectie in interactieve scatterplots bieden u meer mogelijkheden om gegevens te selecteren. De volgende afbeelding toont dezelfde grafische opstelling, maar met een groep punten geselecteerd door te klikken en de muis er omheen te slepen. Dit is niet alleen een visuele functie.
U kunt de geselecteerde punten exporteren als een nieuwe gegevensset. Dit is erg handig en snel!
Als de punten die je nodig hebt niet goed passen in een rechthoekige selectie, heb je andere opties. Raadpleeg het gebied Zoom / Selectie. U ziet een knop met een rechthoek voor rechthoekige selectie en een andere met een ronde vorm voor vrije selectie.
Hier is een voorbeeld van een vrije vorm met behulp van gegevens over het nicotinegehalte van sigaretten die in verschillende delen van de wereld worden verkocht. Deze scatterplot toont nicotine per sigaret voor monsters uit de zes regio's van de Verenigde Naties. (Dit is een niet-traditioneel gebruik van een scatterplot, omdat regio geen continue variabele is, maar categorisch: gegevensmineerders gebruiken vaak traditionele hulpmiddelen op niet-traditionele manieren.)
De punten binnen een regio vallen niet in een perfecte verticale lijn. Kleine verschuivingen (trillingen) naar links en rechts zijn alleen gemaakt voor leesbaarheid en uiterlijk. Een paar sigaretten hebben uitzonderlijk hoge nicotinegehalten en u wilt die gevallen selecteren.
Een vervolgkeuzemenu biedt keuzemogelijkheden. Met de selectie van veelhoeken kunt u een gebied met vrije vorm op de scatterplot markeren.
Klik om te markeren op de grafiek om een beginpunt te maken en klik vervolgens opnieuw en opnieuw rond de gewenste groep punten totdat u de gewenste vorm hebt gemaakt.
Een rechtermuisklik geeft aan dat u de selectie hebt voltooid; dit is zichtbaar vanaf het hoogtepunt in de grafiek.