Video: Excel - Dubbele gegevens verwijderen in Excel - Ontdubbelen - Unieke lijst met filter in Excel 2024
Gegevens worden op verschillende manieren in verschillende systemen opgeslagen. Het is dus geen verrassing dat bij het verzamelen en consolideren van gegevens uit verschillende bronnen, dubbele gegevens kunnen worden weergegeven. Wat een uniek record uniek maakt, is met name verschillend voor verschillende systemen.
Een samenvatting van een beleggingsrekening is bij een accountnummer gevoegd. Een samenvatting van de portfolio kan op individueel of huishoudelijk niveau worden opgeslagen. En de handelsgeschiedenissen van al die rekeningen worden opgeslagen op het individuele transactieniveau.
Het is belangrijk om duidelijk te zijn over wat er wordt verondersteld om unieke records in uw databestand te differentiëren. Als het bijvoorbeeld een transactieniveaubestand is, worden accountnummers en ID's van het huishouden gedupliceerd. Zolang je dit begrijpt en een transactieniveau-analyse uitvoert, komt alles goed.
Maar als u geïnteresseerd bent in het gebruik van deze gegevens om het aantal accounts van elk huishouden te analyseren, zult u problemen tegenkomen. De huishoudens die vaker handelen, zullen meer records hebben dan diegenen die niet veel handelen. U moet een bestand op accountniveau hebben.
Het verwijderen van dubbele records is niet bijzonder moeilijk. De meeste statistische pakketten en databasesystemen hebben ingebouwde opdrachten die records samen groeperen. (In de SQL van de databasetaal wordt deze opdracht Group By genoemd.)