Huis Persoonlijke financiën De rol van traditionele ETL in Big Data - dummies

De rol van traditionele ETL in Big Data - dummies

Video: Frans Duijts - Lekker Aan De Rol 2024

Video: Frans Duijts - Lekker Aan De Rol 2024
Anonim

ETL-hulpmiddelen combineren drie belangrijke functies (uitpakken, transformeren, laden) die nodig zijn om gegevens uit één grote gegevensomgeving te halen en zet het in een andere data-omgeving. Traditioneel werd ETL gebruikt met batchverwerking in omgevingen met datawarehouses. Data warehouses bieden zakelijke gebruikers een manier om informatie te consolideren om gegevens te analyseren en te rapporteren die relevant zijn voor hun zakelijke focus. ETL-hulpmiddelen worden gebruikt om gegevens om te zetten naar het formaat dat door data warehouses wordt vereist.

De transformatie vindt plaats op een tussenlocatie voordat de gegevens in het datawarehouse worden geladen. Veel softwareleveranciers, waaronder IBM, Informatica, Pervasive, Talend en Pentaho, bieden ETL-softwaretools.

ETL biedt de onderliggende infrastructuur voor integratie door drie belangrijke functies uit te voeren:

  • Uitpakken: Gegevens uit de brondatabase lezen.

  • Transformeren: Converteer de indeling van de geëxtraheerde gegevens zodat deze overeenkomt met de vereisten van de doeldatabase. Transformatie wordt gedaan door regels te gebruiken of door gegevens samen te voegen met andere gegevens.

  • Laad: schrijf gegevens naar de doeldatabase.

ETL evolueert echter om integratie te ondersteunen in veel meer dan traditionele datawarehouses. ETL kan integratie tussen transactionele systemen, operationele gegevensopslag, BI-platforms, MDM-hubs, de cloud en Hadoop-platforms ondersteunen. ETL-softwareleveranciers breiden hun oplossingen uit om big data-extractie, -transformatie en -belasting tussen Hadoop en traditionele datamanagementplatforms te bieden.

ETL- en softwaretools voor andere gegevensintegratieprocessen, zoals gegevensschoning, profilering en auditing, werken allemaal aan verschillende aspecten van de gegevens om ervoor te zorgen dat de gegevens betrouwbaar worden geacht. ETL-tools integreren met tools voor gegevenskwaliteit en veel tools bevatten gegevensreiniging, datamapping en het identificeren van datarangges. Met ETL extraheer je alleen de gegevens die je nodig hebt voor de integratie.

ETL-tools zijn nodig voor het laden en converteren van gestructureerde en ongestructureerde gegevens naar Hadoop. Geavanceerde ETL-tools kunnen parallel meerdere bestanden lezen en schrijven van en naar Hadoop om te vereenvoudigen hoe gegevens worden samengevoegd tot een gemeenschappelijk transformatieproces. Sommige oplossingen bevatten bibliotheken met vooraf gebouwde ETL-transformaties voor zowel de transactie- als interactiegegevens die op Hadoop of een traditionele netwerkinfrastructuur worden uitgevoerd.

Gegevensomzetting is het proces waarbij het gegevensformaat wordt gewijzigd, zodat het door verschillende toepassingen kan worden gebruikt.Dit kan een verandering betekenen van het formaat waarin de gegevens zijn opgeslagen in het formaat dat nodig is voor de toepassing die de gegevens zal gebruiken. Dit proces omvat ook toewijzings -instructies, zodat toepassingen worden verteld hoe de benodigde gegevens moeten worden verwerkt.

Het proces van gegevenstransformatie wordt veel complexer gemaakt vanwege de enorme groei van de hoeveelheid ongestructureerde gegevens. Een zakelijke toepassing, zoals een klantrelatiebeheer, heeft specifieke vereisten voor de manier waarop gegevens moeten worden opgeslagen. De gegevens zijn waarschijnlijk gestructureerd in de geordende rijen en kolommen van een relationele database. Gegevens zijn semi-gestructureerd of ongestructureerd als ze niet voldoen aan de vereisten voor rigide indelingen.

De informatie in een e-mailbericht wordt bijvoorbeeld als ongestructureerd beschouwd. Een deel van de belangrijkste informatie van een bedrijf is in ongestructureerde en semi-gestructureerde vormen zoals documenten, e-mailberichten, complexe berichtenformaten, interacties met klantenondersteuning, transacties en informatie afkomstig van verpakte applicaties zoals ERP en CRM.

Hulpprogramma's voor gegevenstransformatie zijn niet ontworpen om goed samen te werken met ongestructureerde gegevens. Als gevolg hiervan hebben bedrijven die ongestructureerde informatie moeten opnemen in de besluitvorming over bedrijfsprocessen te maken gehad met een aanzienlijke hoeveelheid handmatige codering om de vereiste gegevensintegratie tot stand te brengen.

Gezien de groei en het belang van ongestructureerde gegevens voor besluitvorming, beginnen ETL-oplossingen van grote leveranciers gestandaardiseerde benaderingen aan te bieden voor het transformeren van ongestructureerde gegevens zodat deze gemakkelijker kunnen worden geïntegreerd met operationele gestructureerde gegevens.

De rol van traditionele ETL in Big Data - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...