Inhoudsopgave:
- Wat is een uittrekselbestand?
- Dat zijn ze een beetje. Extractbestanden, of het nu in de jaren 1970, 1980, 1990 of vandaag nog steeds in gebruik is, bestaan om dezelfde basisredenen als een volwaardig datawarehouse of een datamart: om informatieverschaffing te bieden, ondanks verschillende barrières, zoals hard -om gegevensstructuren te begrijpen, "raak de regels van het productiesysteem niet" aan en het ontbreken van een kruisverwijzing met meerdere bestanden of meerdere databases.
Video: Web Programming - Computer Science for Business Leaders 2016 2024
Uw organisatie heeft een overweldigend gunstige kans om ten minste één soort gegevensmagazijn te hebben - een rapportagesysteem dat informatiemogelijkheden en soms analytische mogelijkheden biedt voor een of meer groepen gebruikers.
Wat is een uittrekselbestand?
Uw gebruikers gebruiken waarschijnlijk de term uittrekselbestand om dit type omgeving te beschrijven omdat het wordt gevuld door gegevens uit productiesystemen, in plaats van dat gebruikers worden gedwongen om hun query's uit te voeren of hun rapporten van de operationele productiedatabases of bestanden. Ben je nog steeds geïnteresseerd in het spelen van de kansen? Hier zijn een paar voorbeelden van soorten data-omgevingen die kunnen worden omschreven als soort van data warehouses:
-
Hoewel de geëxtraheerde gegevens bijna altijd in één bestand of database zijn ondergebracht, combineert een samenvoegproces waarschijnlijk geëxtraheerde gegevens van meer dan één toepassingsbron. Alleen geselecteerde elementen, niet alle elementen uit alle tabellen of bestanden, uit elke gegevensbron worden gewoonlijk geëxtraheerd en gekopieerd naar het uittrekselbestand.
-
Een proces van gegevenskwaliteitsborging verloopt meestal op elke stap, van het eerste uittreksel tot het laden van de gegevens in het uittrekselbestand.
-
-
Natuurlijk klinkt het als een datawarehouse, nietwaar? De realiteit is dat dit soort datawarehouses typisch een zeer kleine populatie bedienen en niet op een standaard manier worden uitgevoerd om de bredere behoeften van de onderneming te ondersteunen. Je kunt ze ook
Wanna-be-datawarehouses noemen.
Gegevensanalyse "have-nots":
-
Organisaties en individuen die weinig (en waarschijnlijker geen) capaciteiten hebben om het type te doen van analyse die kan leiden tot informatiegestuurde besluitvorming Data-analyse "haves":
-
Organisaties en individuen die mogelijk geen datawarehouse hebben, maar wel iets doen met gegevens waar ze van krijgen ergens. In veel gevallen voldoet het prima aan de bedrijfsbehoeften. Waarom worden extract-bestanden niet beschouwd als datawarehouses?
Dat zijn ze een beetje. Extractbestanden, of het nu in de jaren 1970, 1980, 1990 of vandaag nog steeds in gebruik is, bestaan om dezelfde basisredenen als een volwaardig datawarehouse of een datamart: om informatieverschaffing te bieden, ondanks verschillende barrières, zoals hard -om gegevensstructuren te begrijpen, "raak de regels van het productiesysteem niet" aan en het ontbreken van een kruisverwijzing met meerdere bestanden of meerdere databases.
Sommige voorstanders van data warehousing beweren dat het combineren en herconfigureren van gegevens eenvoudig voor het genereren van rapporten of voor het uitvoeren van statistische analyse, nauwelijks een datawarehouse is in de moderne zin van het woord. Extract-bestanden zijn niet uitgerust met multidimensionale of bedrijfsanalysemogelijkheden, zoals drill-down en data-pivoting.
Als u de gegevensmagazijnkant (wat ervoor nodig is om gegevens uit een of meer bronnen te verzamelen, verplaatsen en opnieuw configureren) te scheiden van de kant van bedrijfsintelligentie (wat u met de gegevens doet nadat u het beschikbaar hebt), beeld wordt veel duidelijker.
Extractbestanden, of hoe u ze ook wilt noemen, maken in hoge mate deel uit van de barrièrebrekende filosofie van een datawarehouse. Veel van wat gebruikers "uitpakken bestanden" noemen, zijn op bestanden gebaseerde systemen (in plaats van op basis van databases), en ze zijn waarschijnlijk niet flexibel genoeg om ad-hoc bevraging en dimensionale analyse te ondersteunen. In echte zin dienen deze omgevingen echter voor opslag van gegevens voor later gebruik.
Voor veel gebruikers hebben bedrijfsanalysemogelijkheden, zoals drill-down en data-pivoting, weinig of geen nut - althans niet in de context van hun huidige taakdefinities. De taken van de gebruikers vragen om functionaliteit die deze uittrekselbestanden kunnen leveren, evenals de statische rapporten en statistische analyses die met die gegevens zijn uitgevoerd.
De moraal van het verhaal: ga niet in een organisatie die effectief gebruikmaakt van gegevens via extractiebestanden en uitleg over de wonderen van datawarehousing. Wees in plaats daarvan voorzichtig met het voorstellen van een oplossing voor datawarehousing die kan worden beschouwd als een stap terug. Als je dit soort voorstellen doet, loop je een lange, hobbelige rit tegemoet.