Video: Susan Etlinger: What do we do with all this big data? 2024
Een deel van Big Data voor kleine bedrijven voor Dummy's Cheat Sheet
Het technische jargon rond big data kan in het begin een beetje intimiderend lijken. De belangrijkste zinnen en termen die u waarschijnlijk tegenkomt, met gemakkelijk te begrijpen definities voor elk, volgen:
-
Big data: In toenemende mate laat alles wat u doet een digitale trace (of gegevens) achter, die u (en anderen) kunnen gebruiken en analyseren. De frase big data verwijst naar die gegevens die worden verzameld en de mogelijkheid om er gebruik van te maken.
-
Big data-analyse: Dit is het proces van het verzamelen, verwerken en analyseren van gegevens om inzichten te genereren die feitengebaseerde besluitvorming ondersteunen. In veel gevallen gaat het om op software gebaseerde analyse met behulp van algoritmen.
-
Algoritme: Een wiskundige formule of een statistisch proces dat door software wordt uitgevoerd om gegevens te analyseren. Het gaat meestal om meerdere berekeningsstappen en kan worden gebruikt om gegevens automatisch te verwerken of problemen op te lossen.
-
Cloud computing: Software of gegevens die op externe servers worden uitgevoerd, in plaats van lokaal. Dus in plaats van dingen op uw eigen computer op te slaan of te berekenen, kunt u andere computers gebruiken die via een netwerk (zoals internet) op uw computer zijn aangesloten.
-
Gestructureerde gegevens: Alle gegevens of informatie in een vast veld binnen een gedefinieerd record of bestand, zoals een database of een spreadsheet. De inherente structuur maakt het snel, gemakkelijk en goedkoop om te analyseren.
-
Ongestructureerde gegevens: Alle gegevens worden niet gemakkelijk opgeslagen en geïndexeerd in traditionele indelingen of databases. Het omvat e-mailconversaties, posts op sociale media, video-inhoud, foto's, spraakopnamen, geluiden enzovoort. Het gebrek aan structuur maakt het moeilijker om te analyseren met behulp van traditionele computerprogramma's.
-
Semi-gestructureerde gegevens: U raadt het al, dit is een kruising tussen ongestructureerde en gestructureerde gegevens. Het zijn gegevens met een bepaalde structuur die kunnen worden gebruikt voor analyse, maar die de strikte structuur missen die wordt gevonden in databases of spreadsheets. Een Facebook-bericht kan bijvoorbeeld worden gecategoriseerd op auteur, datum, lengte en zelfs sentiment, maar de inhoud is over het algemeen ongestructureerd.
-
Interne gegevens: Dit is van toepassing op alle gegevens die uw bedrijf momenteel heeft of zou kunnen openen of genereren in de toekomst. Het kan gestructureerd zijn in een formaat (bijvoorbeeld een klantendatabase) of het kan ongestructureerd zijn (gespreksgegevens van oproepen van de klantenservice).
-
Externe gegevens: Simpel gezegd, dit is de oneindige hoeveelheid informatie die buiten uw bedrijf bestaat. Het kan openbaar beschikbaar of privé gehouden worden en het kan ook gestructureerd of ongestructureerd zijn.
-
Het internet der dingen: Een netwerk dat apparaten (de dingen waarnaar in de naam wordt verwezen) verbindt, zodat ze met elkaar kunnen communiceren. Dit omvat technologie zoals slimme televisies, smartphones en sensoren, en het is allemaal mogelijk dankzij de enorme toename van de connectiviteit tussen apparaten, systemen en services.