Huis Persoonlijke financiën Gestructureerde gegevens in een big data-omgeving - dummies

Gestructureerde gegevens in een big data-omgeving - dummies

Inhoudsopgave:

Video: Wat is Big Data en hoe haal je er uit wat er in zit: de visie van Smart Information Solutions 2024

Video: Wat is Big Data en hoe haal je er uit wat er in zit: de visie van Smart Information Solutions 2024
Anonim

De term gestructureerde gegevens verwijst over het algemeen naar gegevens met een gedefinieerde lengte en indeling voor big data. Voorbeelden van gestructureerde gegevens zijn getallen, datums en groepen woorden en cijfers die tekenreeksen worden genoemd. De meeste experts zijn het erover eens dat dit soort gegevens goed is voor ongeveer 20 procent van de gegevens die er zijn. Gestructureerde gegevens zijn de gegevens waarmee u waarschijnlijk bent gewend. Het wordt meestal opgeslagen in een database.

Bronnen van gestructureerde big data

Hoewel dit misschien als een gewoonte lijkt te lijken, krijgen gestructureerde gegevens in werkelijkheid een nieuwe rol in de wereld van big data. De evolutie van technologie biedt nieuwere bronnen van gestructureerde gegevens die worden geproduceerd - vaak in realtime en in grote volumes. De gegevensbronnen zijn onderverdeeld in twee categorieën:

  • Computer- of computer gegenereerd: Door de computer gegenereerde gegevens hebben doorgaans betrekking op gegevens die zonder menselijke tussenkomst door een machine zijn gemaakt.

  • Door de mens gegenereerd: Dit zijn gegevens die mensen, in interactie met computers, leveren.

Sommige experts beweren dat er een derde categorie bestaat die een hybride is tussen machine en mens. Hier zijn we echter bezorgd over de eerste twee categorieën.

Door de machine gegenereerde gestructureerde gegevens kunnen de volgende zijn:

  • sensorgegevens: Voorbeelden omvatten ID-tags voor radiofrequenties, slimme meters, medische apparaten en gegevens van het Global Positioning System. Bedrijven zijn hierin geïnteresseerd voor supply chain management en voorraadbeheersing.

  • webloggegevens: Wanneer servers, toepassingen, netwerken, enz. Werken, vangen ze allerlei gegevens over hun activiteit. Dit kan grote hoeveelheden gegevens opleveren die bijvoorbeeld nuttig kunnen zijn om overeenkomsten op serviceniveau aan te gaan of om beveiligingsinbreuken te voorspellen.

  • POS-verkoopgegevens: Wanneer de kassier de streepjescode van een product dat u koopt veegt, worden alle gegevens die aan het product zijn gekoppeld gegenereerd.

  • Financiële gegevens: Veel financiële systemen zijn nu programmatisch; ze worden beheerd op basis van vooraf gedefinieerde regels die processen automatiseren. Beursgegevens zijn daar een goed voorbeeld van. Het bevat gestructureerde gegevens zoals het bedrijfssymbool en de dollarwaarde. Sommige van deze gegevens worden door de machine gegenereerd en sommige worden door de mens gegenereerd.

Voorbeelden van gestructureerde door de mens gegenereerde gegevens kunnen het volgende omvatten:

  • Invoergegevens: Dit is een gegeven dat een mens in een computer kan invoeren, zoals naam, leeftijd, inkomen, niet-gratis - antwoorden op enquêtes invullen, enzovoort. Deze gegevens kunnen nuttig zijn om basisgedrag van klanten te begrijpen.

  • Klikstreamgegevens: Gegevens worden gegenereerd elke keer dat u op een koppeling op een website klikt. Deze gegevens kunnen worden geanalyseerd om klantgedrag en koopgedrag te bepalen.

  • Aan gaming gerelateerde gegevens: Elke beweging die u in een spel maakt, kan worden opgeslagen. Dit kan handig zijn om te begrijpen hoe eindgebruikers door een spelportfolio gaan.

Samen met miljoenen andere gebruikers die dezelfde informatie indienen, is de grootte astronomisch. Bovendien hebben veel van deze gegevens een realtime component die nuttig kan zijn voor het begrijpen van patronen die het potentieel hebben om uitkomsten te voorspellen.

Waar het op neerkomt, is dat dit soort informatie krachtig kan zijn en voor veel doeleinden kan worden gebruikt.

De rol van relationele databases in big data

Data-persistentie verwijst naar hoe een database versies van zichzelf behoudt bij wijziging. De overgrootvader van persistente gegevensopslag is het relationele databasebeheersysteem . In de kinderschoenenperiode gebruikte de computerindustrie wat nu als primitieve technieken voor gegevenspersistentie wordt beschouwd.

Het relationele model is bedacht door Edgar Codd, een IBM-wetenschapper, in de jaren 1970 en werd gebruikt door IBM, Oracle, Microsoft en anderen. Het is nog steeds in gebruik en speelt een belangrijke rol in de evolutie van big data. Het begrijpen van de relationele database is belangrijk omdat andere soorten databases worden gebruikt met big data.

In een relationeel model worden de gegevens in een tabel opgeslagen. Deze database zou een schema bevatten, dat wil zeggen een structurele weergave van wat er in de database staat. In een relationele database definieert het schema bijvoorbeeld de tabellen, de velden in de tabellen en de relaties tussen de twee.

De gegevens worden opgeslagen in kolommen, één voor elk specifiek kenmerk. De gegevens worden ook opgeslagen in de rij. De eerste tabel slaat productinformatie op; de tweede slaat demografische informatie op. Elk heeft verschillende attributen. Elke tabel kan worden bijgewerkt met nieuwe gegevens en gegevens kunnen worden verwijderd, gelezen en bijgewerkt. Dit wordt vaak bereikt in een relationeel model met behulp van een gestructureerde query-taal (SQL).

Een ander aspect van het relationele model met behulp van SQL is dat tabellen kunnen worden opgevraagd met een gemeenschappelijke sleutel. De gemeenschappelijke sleutel in de tabellen is CustomerID.

U kunt een query indienen om bijvoorbeeld het geslacht te bepalen van klanten die een specifiek product hebben gekocht. Het ziet er ongeveer zo uit:

Selecteer CustomerID, State, Gender, Product from "demographic table", "product table" where Product = XXYY
Gestructureerde gegevens in een big data-omgeving - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...