Huis Persoonlijke financiën Big Data Analysis en het Data Warehouse - dummies

Big Data Analysis en het Data Warehouse - dummies

Inhoudsopgave:

Video: Introducing the modern data warehouse solution pattern with Azure SQL Data Warehouse 2024

Video: Introducing the modern data warehouse solution pattern with Azure SQL Data Warehouse 2024
Anonim

Je zult er waarde in vinden om de mogelijkheden van het datawarehouse en de big data-omgeving bij elkaar te brengen. U moet een hybride omgeving creëren waarin big data hand in hand kan werken met het datawarehouse.

Ten eerste is het belangrijk om te beseffen dat het datawarehouse zoals het vandaag is ontworpen op korte termijn niet zal veranderen.

Daarom is het pragmatischer om het datawarehouse te gebruiken voor wat het is ontworpen om te doen - zorg voor een goed uitgevoerde versie van de waarheid over een onderwerp dat het bedrijf wil analyseren. Het magazijn kan informatie bevatten over de productlijn van een bepaald bedrijf, zijn klanten, zijn leveranciers en de details van de transacties van een jaar.

De informatie die wordt beheerd in het datawarehouse of een datamart van de afdeling is zorgvuldig samengesteld, zodat de metagegevens juist zijn. Met de groei van nieuwe webgebaseerde informatie is het praktisch en vaak noodzakelijk om deze enorme hoeveelheid gegevens te analyseren in samenhang met historische gegevens. Hier komt het hybride model om de hoek kijken.

Bepaalde aspecten van het trouwen met het datawarehouse met big data kunnen relatief eenvoudig zijn. Veel van de big data-bronnen zijn bijvoorbeeld afkomstig van bronnen met hun eigen goed ontworpen metadata. Complexe e-commercesites bevatten duidelijk gedefinieerde data-elementen. Daarom werkt de informatiebeheerorganisatie bij het uitvoeren van analyses tussen het magazijn en de big data-bron met twee datasets met zorgvuldig ontworpen metadatamodellen die moeten worden gerationaliseerd.

Natuurlijk missen de informatiebronnen in sommige situaties expliciete metadata. Voordat een analist de historische transactiegegevens kan combineren met de minder gestructureerde big data, moet er werk worden verzet. Doorgaans zal een eerste analyse van petabytes aan gegevens interessante patronen onthullen die kunnen helpen bij het voorspellen van subtiele bedrijfsveranderingen of mogelijke oplossingen voor de diagnose van een patiënt.

De eerste analyse kan worden voltooid door gebruik te maken van hulpmiddelen zoals MapReduce met het Hadoop-gedistribueerde bestandssysteem. Op dit punt kun je beginnen te begrijpen of het in staat is om te helpen evalueren welk probleem wordt aangepakt.

In het analyseproces is het net zo belangrijk om onnodige gegevens te verwijderen als om gegevens te identificeren die relevant zijn voor de bedrijfscontext. Wanneer deze fase is voltooid, moeten de overblijvende gegevens worden getransformeerd, zodat definities van metadata nauwkeurig zijn. Op deze manier, wanneer de big data wordt gecombineerd met traditionele, historische gegevens uit het magazijn, zijn de resultaten nauwkeurig en zinvol.

De big data-integratie-lynchpin

Dit proces vereist een goed gedefinieerde strategie voor gegevensintegratie. Hoewel data-integratie een kritiek element is bij het beheer van big data, is het net zo belangrijk bij het maken van een hybride analyse met het datawarehouse. Het proces van het extraheren van gegevens en het transformeren ervan in een hybride omgeving lijkt in feite op hoe dit proces wordt uitgevoerd in een traditioneel datawarehouse.

In het datawarehouse worden gegevens geëxtraheerd uit traditionele bronsystemen zoals CRM- of ERP-systemen. Het is van cruciaal belang dat elementen uit deze verschillende systemen correct worden vergeleken.

Revisie van extractie, transformatie en belastingen voor datawarehouses

In het datawarehouse vindt u vaak een combinatie van relationele databasetabellen, platte bestanden en niet-relationele bronnen. Een goed geconstrueerd datawarehouse wordt zodanig ontworpen dat de gegevens worden omgezet in een gemeenschappelijk formaat, zodat query's nauwkeurig en consistent kunnen worden verwerkt. De geëxtraheerde bestanden moeten worden getransformeerd om overeen te komen met de bedrijfsregels en processen van het onderwerpgebied dat het datawarehouse is ontworpen om te analyseren.

Met andere woorden, de gegevens moeten worden geëxtraheerd uit de big data-bronnen, zodat deze bronnen veilig kunnen samenwerken en zinvolle resultaten kunnen opleveren. Bovendien moeten de bronnen worden getransformeerd, zodat ze nuttig zijn voor het analyseren van de relatie tussen de historische gegevens en de meer dynamische en realtime gegevens die afkomstig zijn van big data-bronnen.

Het laden van informatie in het big data-model zal anders zijn dan wat u zou verwachten in een traditioneel datawarehouse. Met datawarehouses verandert de data nooit nadat de gegevens zijn gecodificeerd. Een typisch datawarehouse zal het bedrijf een momentopname van gegevens bieden op basis van de noodzaak om een ​​bepaald bedrijfsprobleem te analyseren dat monitoring vereist, zoals voorraad of verkoop.

De gedistribueerde structuur van big data leidt organisaties vaak eerst gegevens in een reeks knooppunten te laden en vervolgens de extractie en transformatie uit te voeren. Bij het creëren van een hybride van het traditionele datawarehouse en de big data-omgeving, kan de gedistribueerde aard van de big data-omgeving het vermogen van organisaties om grote hoeveelheden gegevens te analyseren in de context van het bedrijf drastisch veranderen.

Big Data Analysis en het Data Warehouse - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...