Huis Persoonlijke financiën Ongestructureerde gegevens in een Big Data-omgeving - dummies

Ongestructureerde gegevens in een Big Data-omgeving - dummies

Inhoudsopgave:

Video: Wat is Big Data en hoe haal je er uit wat er in zit: de visie van Smart Information Solutions 2024

Video: Wat is Big Data en hoe haal je er uit wat er in zit: de visie van Smart Information Solutions 2024
Anonim

Ongestructureerde gegevens zijn gegevens die geen specifiek formaat voor big data bevatten. Als 20 procent van de gegevens die beschikbaar zijn voor ondernemingen gestructureerde gegevens zijn, is de overige 80 procent ongestructureerd. Ongestructureerde data zijn eigenlijk de meeste data die je tegenkomt. Tot voor kort ondersteunde de technologie echter niet echt veel, behalve het opslaan of handmatig analyseren.

Bronnen van ongestructureerde big data

Ongestructureerde gegevens zijn overal. In feite, de meeste individuen en organisaties hun leven rond ongestructureerde gegevens. Net als bij gestructureerde gegevens, worden ongestructureerde gegevens door de computer gegenereerd of door mensen gegenereerd.

Hier volgen enkele voorbeelden van door de machine gegenereerde ongestructureerde gegevens:

  • Satellietafbeeldingen: Dit omvat weergegevens of de gegevens die de overheid vastlegt in de beelden van satellietsurveillance. Denk maar aan Google Earth en je krijgt de foto.

  • Wetenschappelijke gegevens: Dit omvat seismische beelden, atmosferische gegevens en hoogenergetische fysica.

  • Foto's en video: Dit omvat beveiliging, bewaking en verkeersvideo.

  • Radar- of sonarmegevens: Dit omvat voertuig-, meteorologische en oceanografische seismische profielen.

De volgende lijst toont enkele voorbeelden van door de mens gegenereerde ongestructureerde gegevens:

  • Tekst intern voor uw bedrijf: Denk aan alle tekst in documenten, logboeken, enquêteresultaten en e-mails. Enterprise-informatie vertegenwoordigt tegenwoordig een groot percentage van de tekstinformatie in de wereld.

  • Sociale mediadata: Deze gegevens worden gegenereerd op basis van de sociale mediaplatforms zoals YouTube, Facebook, Twitter, LinkedIn en Flickr.

  • Mobiele gegevens: Dit omvat gegevens zoals tekstberichten en locatie-informatie.

  • website-inhoud: Dit komt van elke site die ongestructureerde inhoud levert, zoals YouTube, Flickr of Instagram.

En de lijst gaat maar door.

Sommige mensen denken dat de term ongestructureerde gegevens misleidend is, omdat elk document zijn eigen specifieke structuur of opmaak kan bevatten op basis van de software die het heeft gemaakt. Wat echter intern is aan het document, is echt ongestructureerd.

Verreweg, ongestructureerde data is het grootste deel van de data-vergelijking, en de use cases voor ongestructureerde data breiden zich snel uit. Alleen al aan de tekstkant kunnen tekstanalyses worden gebruikt om ongestructureerde tekst te analyseren en relevante gegevens te extraheren en die gegevens om te zetten in gestructureerde informatie die op verschillende manieren kan worden gebruikt.

Een populaire case voor big data-gebruik is bijvoorbeeld analyse van sociale media voor gebruik bij gesprekken met grote volumes klanten. Daarnaast worden ongestructureerde gegevens uit callcenternotities, e-mails, schriftelijke opmerkingen in een enquête en andere documenten geanalyseerd om het gedrag van klanten te begrijpen. Dit kan worden gecombineerd met sociale media van tientallen miljoenen bronnen om de klantervaring te begrijpen.

De rol van een CMS in big data management

Organisaties slaan enkele ongestructureerde gegevens op in databases. Ze maken echter ook gebruik van enterprise content management-systemen (CMS's) die de volledige levenscyclus van content kunnen beheren. Dit kan webinhoud, documentinhoud en andere vormenmedia omvatten.

Volgens de Association for Information and Image Management (AIIM), een non-profitorganisatie die educatie, onderzoek en best practices levert, omvat Enterprise Content Management (ECM) de "strategieën, methoden en hulpmiddelen voor het verzamelen, beheren, beheren inhoud en documenten opslaan, bewaren en afleveren met betrekking tot organisatieprocessen. "De technologieën in ECM omvatten documentbeheer, records management, imaging, workflow management, web content management en samenwerking.

Er is een hele industrie gegroeid rond het beheren van content en veel verkopers van contentmanagement schalen hun oplossingen uit om grote hoeveelheden ongestructureerde data te verwerken. Nieuwe technologieën evolueren echter ook om ongestructureerde gegevens te ondersteunen en om ongestructureerde gegevens te analyseren. Sommige hiervan ondersteunen zowel gestructureerde als ongestructureerde gegevens. Sommigen ondersteunen real-time streams. Deze omvatten technologieën zoals Hadoop, MapReduce en streaming.

Systemen die zijn ontworpen om inhoud op te slaan in de vorm van inhoudbeheersystemen zijn niet langer op zichzelf staande oplossingen. In plaats daarvan zullen ze waarschijnlijk deel uitmaken van een algehele oplossing voor gegevensbeheer. Uw organisatie kan bijvoorbeeld Twitter-feeds volgen die vervolgens een CMS-zoekopdracht programmatisch kunnen activeren.

Nu krijgt de persoon die de tweet heeft geactiveerd een antwoord terug dat een locatie biedt waar het individu het product kan vinden waarnaar hij of zij op zoek is. Het grootste voordeel is wanneer dit type interactie in realtime kan plaatsvinden. Het illustreert ook de waarde van het gebruik van real-time ongestructureerde, gestructureerde (klantgegevens over de persoon die tweette) en semi-gestructureerde (de werkelijke inhoud in de CMS) gegevens.

De realiteit is dat u waarschijnlijk een hybride aanpak zult gebruiken om uw problemen met big data op te lossen. Het heeft bijvoorbeeld geen zin om al uw nieuwsinhoud bijvoorbeeld in Hadoop op uw locatie te plaatsen, omdat deze verondersteld wordt ongestructureerde gegevens te beheren.

Ongestructureerde gegevens in een Big Data-omgeving - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...