Inhoudsopgave:
Video: Here Be Dragons 2024
Hoog volume, grote variëteit en hoge snelheid zijn de essentiële kenmerken van big data. Maar andere kenmerken van big data zijn even belangrijk, vooral wanneer u big data toepast op operationele processen. Deze tweede set van "V" -kenmerken die essentieel zijn voor het operationaliseren van big data, bevat
-
Geldigheid: Zijn de gegevens correct en nauwkeurig voor het beoogde gebruik?
-
Waarachtigheid: Zijn de resultaten zinvol voor de gegeven probleemruimte?
-
Volatiliteit: Hoe lang moet je deze gegevens opslaan?
Geldigheid van grote gegevens
U wilt nauwkeurige resultaten. Maar in de beginfase van het analyseren van petabytes aan gegevens, is het waarschijnlijk dat u zich geen zorgen hoeft te maken over hoe geldig elk gegevenselement is. Die eerste stroom big data is misschien best vies. In de beginfase is het belangrijker om te zien of er relaties bestaan tussen elementen binnen deze enorme gegevensbron dan om te zorgen dat alle elementen geldig zijn.
Nadat een organisatie echter bepaalt dat delen van die initiële gegevensanalyse belangrijk zijn, moet deze subset van big data worden gevalideerd omdat deze nu zal worden toegepast op een operationele conditie. Wanneer de gegevens van verkennend naar handelbaar zijn, moeten gegevens worden gevalideerd. De geldigheid van big data-bronnen en de daaropvolgende analyse moeten accuraat zijn als u de resultaten voor de besluitvorming wilt gebruiken.
Geldige invoergegevens gevolgd door correcte verwerking van de gegevens moeten nauwkeurige resultaten opleveren. Met big data moet u extra waakzaam zijn met betrekking tot de geldigheid. In de gezondheidszorg kunt u bijvoorbeeld gegevens van een klinische proef hebben die verband kunnen houden met de ziektesymptomen van een patiënt. Maar een arts die deze persoon behandelt, kan de resultaten van de klinische proef niet eenvoudigweg nemen zonder deze te valideren.
Stel je voor dat de weersatelliet aangeeft dat een storm begint in één deel van de wereld. Hoe beïnvloedt die storm individuen? Met ongeveer een half miljard gebruikers is het mogelijk om Twitter-streams te analyseren om de impact van een storm op de lokale bevolking te bepalen. Daarom zou het gebruik van Twitter in combinatie met gegevens van een weersatelliet onderzoekers kunnen helpen de juistheid van een weersvoorspelling te begrijpen.
Volatiliteit van grote gegevens
Als u over geldige gegevens beschikt en de waarheidsgetrouwheid van de resultaten kunt aantonen, hoe lang moeten de gegevens dan "leven" om aan uw behoeften te voldoen? In een standaard gegevensinstelling kunt u gegevens tientallen jaren bewaren, omdat u in de loop van de tijd een goed begrip hebt opgebouwd van welke gegevens belangrijk zijn voor wat u ermee doet.U hebt regels opgesteld voor gegevensvaluta en beschikbaarheid die verwijzen naar uw werkprocessen.
Sommige organisaties behouden bijvoorbeeld mogelijk het meest recente jaar van hun klantgegevens en transacties in hun bedrijfssystemen. Dit zorgt ervoor dat deze informatie snel wordt opgevraagd wanneer dat nodig is. Als ze naar een vorig jaar moeten kijken, moet het IT-team mogelijk gegevens uit de offline opslag herstellen om het verzoek te honoreren. Met big data wordt dit probleem vergroot.
Als de opslag beperkt is, kijk dan naar de grote gegevensbronnen om te bepalen wat u moet verzamelen en hoe lang u dit moet bewaren. Bij sommige grote gegevensbronnen moet u wellicht gegevens verzamelen voor een snelle analyse.
U kunt de informatie vervolgens lokaal opslaan voor verdere verwerking. Als u niet genoeg opslagruimte hebt voor al deze gegevens, kunt u de gegevens "on the fly" verwerken en alleen relevante stukjes informatie lokaal bewaren. Hoe lang u grote gegevens beschikbaar houdt, is afhankelijk van een paar factoren:
-
Hoeveel gegevens worden bij de bron bewaard?
-
Moet u de gegevens herhaaldelijk verwerken?
-
Moet u de gegevens verwerken, extra gegevens verzamelen en meer verwerken?
-
Zijn er regels of voorschriften die gegevensopslag vereisen?
-
Zijn uw klanten afhankelijk van uw gegevens voor hun werk?
-
Hebben de gegevens nog steeds waarde of is deze niet langer relevant?
Vanwege het volume, de variëteit en de snelheid van big data moet u de volatiliteit begrijpen. Voor sommige bronnen zijn de gegevens altijd aanwezig; voor anderen is dit niet het geval. Begrijpen welke gegevens er zijn en voor hoelang kunnen u helpen bij het definiëren van bewaarvereisten en -beleid voor big data.
Als consument helpen big data om een beter profiel te definiëren voor hoe en wanneer u goederen en services aanschaft. Als patiënt zullen big data helpen om een meer aangepaste benadering van behandelingen en gezondheidsonderhoud te definiëren. Als professional helpen big data u met het identificeren van betere manieren om uw producten en services te ontwerpen en te leveren.
Dit gebeurt alleen als big data wordt geïntegreerd in de bedrijfsprocessen van bedrijven en organisaties.