Video: 444 years young: a beautiful birthday celebration! 2024
Gegevensprivacy is een groot probleem voor gegevens mijnwerkers. Nieuwsrapporten waarin het niveau van persoonlijke gegevens in handen is van het nationale veiligheidsagentschap van de Amerikaanse overheid en inbreuken op commerciële gegevensbronnen het publieke bewustzijn en de bezorgdheid hebben verhoogd.
Een centraal concept in gegevensprivacy is persoonlijk identificeerbare informatie (PII), of alle gegevens die kunnen worden herleid tot de persoon die het beschrijft. PII bevat duidelijke identificatiegegevens, zoals namen, creditcardnummers en burgerservicenummers, en de meeste gegevensmijnen zijn zich ervan bewust dat dit soort gegevens privé zijn en met zorg moeten worden behandeld. Maar PII verwijst naar meer dan alleen deze voor de hand liggende identificaties.
Alle gegevens die kunnen worden gebruikt om een persoon te identificeren, zelfs als dit het gebruik van meerdere velden in combinatie of het manipuleren van de gegevens op een of andere manier vereist, zijn ook PII. Het is gemakkelijk voor data mijnwerkers om dit soort data over het hoofd te zien, het soort dat niet op het oppervlak verschijnt om privé te zijn, en toch voldoende zou kunnen zijn voor persoonlijke identificatie als het voor dat doel gemanipuleerd zou zijn. Als er een manier is waarop gegevens kunnen worden gemanipuleerd om personen te identificeren, moet deze worden behandeld met dezelfde voorzorgsmaatregelen als waarmee u een lijst met creditcardnummers opgeeft.
Dat is waar data mijnwerkers gemakkelijk zichzelf in de problemen kunnen brengen. Er zijn veel manieren om individuen te identificeren als je een beetje moeite doet om dat te doen. In een opmerkelijk voorbeeld heeft AOL Research gebruikerszoekrecords vrijgegeven voor onderzoeksdoeleinden. De gegevens waren bedoeld om anoniem te zijn, er waren geen namen in, maar The New York Times meldde dat het een persoon uit de zoekgegevens had kunnen identificeren door middel van kruisverwijzingen met telefoonlijsten. Later maakte Netflix filmbeoordelingsgegevens beschikbaar voor gebruik in een competitie en al snel bleek dat deze gegevens ook konden worden gebruikt om individuen te identificeren.
In je werk als dataminer heb je mogelijk ervaringen met potentiële klanten die gegevens hebben gedeeld waarvan ze beweerden dat ze anoniem waren (of zelfs nagebootst om een discussiepunt te illustreren), maar ontdekten dat de gegevens niets van dien aard. Wetens of niet, deze mensen overtreden wetten inzake gegevensprivacy en tonen een gebrek aan respect voor hun eigen klanten.
Hoe kun je rampen als deze voorkomen? Probeer het niet alleen te doen. Het is een uitdaging om de naleving van alle relevante wetten voor gegevensprivacy te verzekeren, om nog maar te zwijgen van andere goede zakelijke praktijken. Jenny Juliany, Vice President Solutions Architecture en mede-oprichter van Intreis, een oplossingsintegrator gespecialiseerd in servicemanagement en compliance-automatisering, beschrijft de levenscyclus van gegevens met een analogie met de vier seizoenen:
-
Lente: Inception, de gegevens zijn gemaakt.
-
Zomer: Primetime, de gegevens worden actief gebruikt.
-
Herfst: Pensionering, de gegevens zijn niet langer relevant of worden gebruikt, maar er kunnen wettelijke of andere redenen zijn om deze te behouden.
-
Winter: Verwijderen, de gegevens worden vernietigd.
Elk seizoen heeft zijn eigen kenmerken, met verschillende vereisten met betrekking tot gegevensprivacy. Sommige zijn gebaseerd op de wet, anderen op gezond verstand en nog andere op individuele overeenkomsten met klanten en de bedrijfspraktijken van uw eigen werkgever. Het is niet realistisch om te geloven dat u naast deze primaire rol al deze compliance-details kunt opnemen, dus u moet samenwerken met de datamanagementprofessionals van uw organisatie.
U wilt niet het centrum zijn van het volgende grote schandaal over gegevensprivacy. Respect voor gegevensprivacy en correct gegevensbeheer is de sleutel tot het minimaliseren van dat risico. Wacht niet tot er iets misgaat, neem vandaag nog contact op met de expert op het gebied van gegevensprivacy in uw eigen organisatie en bouw een werkend partnerschap op om gevoelige gegevens goed te beheren.
Meer informatie over de datalevenscyclus van Jenny Juliany over de Four Seasons of Data Management vindt u hier:
-
'Lente' Inception
-
'Summer' Primetime
-
'Fall' Pensioen
-
'Winter 'Verwijdering