Video: Rabo Internetbankieren Professional - Autorisaties - Personaliseren gebruikers 2024
Voor uw project met voorspellende analyse moet u geschikte gegevensbronnen identificeren, gegevens uit die bronnen verzamelen en deze plaatsen in een gestructureerd, overzichtelijk formaat. Deze taken kunnen zeer uitdagend zijn en vereisen waarschijnlijk een zorgvuldige coördinatie tussen verschillende gegevensbeheerders in uw organisatie.
U moet ook de variabelen selecteren die u gaat analyseren. Dit proces moet rekening houden met databeperkingen, projectbeperkingen en bedrijfsdoelstellingen.
De variabelen die u selecteert, moeten voorspellend vermogen hebben. Ook moet u rekening houden met variabelen die zowel waardevol als haalbaar zijn voor uw project binnen het budget en de tijdschema's. Als u bijvoorbeeld banktransacties in een strafrechtelijk onderzoek analyseert, kunnen telefoongegevens voor alle betrokken partijen relevant zijn voor de analyse, maar niet toegankelijk voor de analisten.
Verwacht veel tijd te besteden aan deze fase van het project. Datacollectie, data-analyse en het proces van adressering van data-inhoud, kwaliteit en structuur kan een tijdrovende to-do lijst opleveren.
Tijdens het proces van gegevensidentificatie helpt het om uw gegevens en de eigenschappen ervan te begrijpen; deze kennis helpt u bij het kiezen van het algoritme dat u moet gebruiken om uw model te bouwen. Tijdreeksgegevens kunnen bijvoorbeeld worden geanalyseerd door regressiealgoritmen; classificatiealgoritmen kunnen worden gebruikt om discrete gegevens te analyseren.
Variabele selectie wordt beïnvloed door hoe goed u de gegevens begrijpt. Wees niet verbaasd als je honderden variabelen moet bekijken en evalueren, in eerste instantie. Gelukkig, terwijl je met deze variabelen werkt en belangrijke inzichten begint te verwerven, begin je ze te beperken tot een paar dozijn. Verwacht ook dat de variabele selectie verandert als uw kennis van de gegevens gedurende het project verandert.
U vindt het misschien handig om een gegevensinventaris op te bouwen die u kunt gebruiken om bij te houden wat u weet, wat u niet weet en wat er misschien ontbreekt. De gegevensinventarisatie moet een lijst bevatten van de verschillende gegevenselementen en alle attributen die relevant zijn in de daaropvolgende stappen van het proces.
U wilt bijvoorbeeld misschien documenteren of er segmenten ontbreken voor een postcode of voor een specifieke periode ontbreken.
Uw go-to-mensen voor zakelijke kennis (ook wel domeinkennisexperts genoemd) zullen u helpen bij het selecteren van de belangrijkste variabelen die de resultaten van uw project positief kunnen beïnvloeden. Ze kunnen u het belang van deze variabelen uitleggen, evenals waar en hoe ze te krijgen, naast andere waardevolle input.