Video: Big Data Analytics 2024
In het verleden verzamelde gegevens waren gestructureerd en konden in nette rijen en kolommen passen. Een voorbeeld hiervan is een Excel-spreadsheet met gescheiden gegevens (gegevens die werden gescheiden door een specifiek teken, zoals een komma). De meeste interne informatiespecialisten waren tevreden met het weergeven van deze gegevens (zoals klantrecords) in lange spreadsheets. Ze moesten rapporteren wat de gegevens zeiden en iedereen gebruikte dezelfde resultaten.
Met gestructureerde gegevens was er geen mogelijkheid om het verhaal te visualiseren dat de gegevens vertelden om waardevolle inzichten te extraheren. De gegevens waren niet interactief en stonden geen maatwerk toe. Het was waardevol tot op zekere hoogte, maar er was geen manier om te begrijpen wat de klant van het product vond nadat ze het hadden gekocht. Je zou alleen weten dat het product was gekocht. En die gegevens vormen slechts een deel van de puzzel.
Tegenwoordig worden bedrijven geconfronteerd met een berg van een nieuw type gegevens: ongestructureerde gegevens, die niet altijd in een nette verpakking zijn. Hier volgen enkele voorbeelden van dit type gegevens:
-
Adviezen: De meningen zijn verzameld door beoordelingssites zoals Yelp, weergegeven in de volgende afbeelding. U kunt rechtstreeks toegang krijgen tot de beoordelingen of een tool gebruiken die de gegevens van de site schrapt, zodat u die gegevens in uw eigen gegevens-viz-tool kunt plaatsen.
-
Beeldmateriaal: Beeldmateriaal wordt gekozen door gebruikers van sites zoals Pinterest, weergegeven in de onderstaande afbeelding. In het geval van Pinterest hebt u toegang tot de site om te zien welke afbeeldingen van en door uw bedrijf zijn vastgezet door klanten die op zoek zijn naar de naam van uw bedrijf. U kunt gegevens hebben over welke pinnen die uw bedrijf op Pinterest zet door anderen opnieuw worden vastgepind, evenals gegevens over mensen die het product of de afbeelding van uw bedrijf elders op internet hebben gezien en deze rechtstreeks op Pinterest hebben vastgezet zodat anderen ze kunnen vinden.
-
Smartphonegegevens: Telefoongegevens, e-mails en andere zoekgegevens zijn beschikbaar vanaf uw telefoon.
Deze ongestructureerde inhoud vertegenwoordigt gegevens die ongelooflijk waardevol zijn voor elk online bedrijf. De sleutel tot het gebruik van de gegevens is het gebruik van softwareprogramma's (zoals SAP) waarmee u gestructureerde gegevens kunt combineren met ongestructureerde gegevens om meer inzicht te krijgen in het bedrijf en zijn klanten. Uit deze analyse kunnen bedrijven voorspellingen doen over klantgedrag en het genereren van inkomsten.
Gewoonlijk gebruiken organisaties die ongestructureerde gegevens gebruiken natuurlijke taalverwerkingssoftware om deze te analyseren.