Video: Warehouse Builder - Concept 2024
Een datawarehouse lite is een eenvoudige, kale, low-tech benadering voor het leveren van gegevens die kunnen helpen bij sommige van uw zakelijke besluitvorming. No-nonsense betekent dat u, waar mogelijk, beproefde mogelijkheden en hulpmiddelen binnen uw organisatie samenstelt om uw systeem te bouwen.
Onderwerpsgebieden en gegevensinhoud van een datawarehouse lite
Een datawarehouse lite is gericht op de rapportage of analyse van slechts één of mogelijk twee onderwerpgebieden. Stel dat u in uw baan bij een draadloze divisie van een telefoonbedrijf de verkoop van services analyseert, zoals minuten in het netwerk, minuten buiten het netwerk, sms-berichten, internettoegang en ander mobiel gebruik voor huishoudens.
Als u een datawarehouse lite exclusief voor dit doel bouwt, beschikt u over alle nodige informatie om uw analyse en rapportage voor de consumentenmarkt te ondersteunen. U hebt echter geen informatie over zakelijke gebruikers en betalingsgeschiedenis, omdat die informatie deel uitmaakt van een ander onderwerp, zoals weergegeven in deze afbeelding.
Op basis van de gebiedsbeperking heeft een datawarehouse-lite net voldoende datacontent om te voldoen aan het primaire doel van de omgeving, maar niet genoeg voor veel ongestructureerde what-if-scenario's die de gebruikers kunnen maken.
Je moet dus zorgvuldig kiezen uit de reeks van alle mogelijke gegevenselementen en een beheersbare subset selecteren - elementen die zonder twijfel belangrijk zijn om te hebben. Dit proces is hetzelfde voor elke implementatie van een datawarehouse, behalve dat u uiterst gedisciplineerd moet zijn wanneer u beslissingen neemt over welke content u wilt opnemen.
Gebruik standaardrapporten, vooral rapporten die momenteel veel handmatige voorbereiding vereisen, als een van uw belangrijkste handleidingen om de gegevensinhoud in een datawarehouse-lite te bepalen.
Gegevensbronnen
Een datawarehouse-lite heeft een beperkte set gegevensbronnen - meestal één tot een handvol. Als onderdeel van een algemene omgeving met één toepassing fungeert het datawarehouse lite bijvoorbeeld als de herstructureringsagent voor de gegevens van de toepassing om het meer query- en rapportvriendelijk te maken.
De meest gebruikelijke manier om de gegevens van een enkele toepassing te herstructureren is om de inhoud van de relationele databasetabellen van de toepassing te denormaliseren om zo veel relationele join-bewerkingen (het proces waarbij gegevens uit meer dan één databasetabel samenkomen) te elimineren) mogelijk wanneer gebruikers rapporten uitvoeren of eenvoudige query's uitvoeren.
Denormalisatie is het tegenovergestelde van het relationele databaseconcept van normalisatie, een ietwat complexe reeks richtlijnen die u vertelt welke gegevenselementen in welke tabellen in een database moeten zijn.
Wanneer u een database denormaliseert , hoeft u zich geen zorgen te maken over dubbele gegevens; u probeert rijen met gegevens te maken in een enkele tabel die hoogstwaarschijnlijk overeenkomt met de rapporten en query's die gebruikers uitvoeren. Deze afbeelding toont een voorbeeld van een single-source datawarehouse lite gebouwd op denormalisatie.
Hoewel u extern verstrekte gegevens kunt gebruiken in een implementatie van een datawarehouse-lite, zijn de gegevens die u gebruikt, zelden nieuw verworven. U neemt waarschijnlijk eerder gegevens op die u al voor analyse gebruikt (misschien op een zelfstandige manier).
Business Intelligence-hulpprogramma's
De gebruikers van een data warehouse-lite stellen meestal vragen en maken rapporten met een "Vertel mij wat er is gebeurd" -perspectief. Omdat deze gebruikers niet veel analytische verwerkingen uitvoeren, moeten de producten die ze gebruiken om toegang te krijgen tot het datawarehouse eenvoudig te gebruiken zijn.
Gegevens extraheren, verplaatsen en laden
Eenvoud is de naam van het spel in een datawarehouse lite. Maak daarom het proces van het extraheren van gegevens uit bronnen en het uitvoeren van alle noodzakelijke functies om die gegevens zo eenvoudig mogelijk voor te bereiden door deze twee elementen te gebruiken:
-
Eenvoudige bestandsuittreksels uit de run-the-business-systemen en bestandsoverdrachten die kunt u gegevens verplaatsen van de bronnen naar het datawarehouse lite
-
Duidelijke aangepaste code (of een eenvoudig te gebruiken hulpmiddel) die de gegevens kan extraheren en verplaatsen
Als de gegevensbron voor uw datawarehouse lite is gebouwd op een relationele database en u bent van plan hetzelfde databaseproduct te gebruiken voor uw datawarehouse, gebruik SQL om gemakkelijk data-extractie en verplaatsing af te handelen. Deze stappen - zoals weergegeven in de afbeelding - bieden een standaardprocedure voor dit proces (u wilt natuurlijk deze stappen aanpassen aan uw specifieke omgeving):
-
Gebruik het SQL CREATE TABLE op het systeem waarin uw magazijn is ondergebracht statement om de definitie voor elke tabel in uw datawarehouse lite te maken.
-
Maak een database back-up die kopieën bevat van alle tabellen uit de bron die gegevens leveren aan het magazijn en laad deze tabellen vervolgens opnieuw in een verzamelgebied op het systeem waarop u uw gegevensmagazijn wilt vinden.
Controleer of de bandbreedte en het tijdvenster van het netwerk voldoende zijn om alle brontabellen naar het systeem te kopiëren met behulp van een programma voor bestandsoverdracht.
-
Gebruik de SQL INSERT-instructie, met een geneste SELECT-instructie die de brontabellen en hun respectieve kolommen specificeert die de tabel met gegevensmagazijnen vullen (en hoe de tabellen worden samengevoegd), om de gegevens in uw datawarehouse lite te laden.
-
Voer een reeks kwaliteitscontroleroutines (QA-routines) uit om te controleren of alle gegevens correct zijn geladen.
Controleer rijaantallen, numerieke totalen en wat u nog meer kunt doen.
Architectuur
De architectuur van een datawarehouse lite bestaat uit de database die wordt gebruikt om de gegevens op te slaan, de front-end business intelligence-tools die worden gebruikt om toegang te krijgen tot de gegevens, de manier waarop de gegevens worden verplaatst en het aantal onderwerpen gebieden.Het motto van deze omgeving is minimalistisch: geen toeters, geen fluitjes, niets speciaals - net genoeg technologie toegepast op de omgeving om gebruikers toegang te geven tot de gegevens die ze nodig hebben.
De architectuur van een data warehouse-lite, zoals weergegeven in deze afbeelding, bevat de volgende hoofdcomponenttypen:
-
Eén enkele database bevat de gegevens van het magazijn.
-
Die database wordt rechtstreeks gevoed vanuit elk van de bronnen die gegevens leveren aan het magazijn.
-
Gebruikers hebben rechtstreeks vanuit het magazijn toegang tot gegevens.