Huis Persoonlijke financiën De basisprincipes van Big Data Integration - dummies

De basisprincipes van Big Data Integration - dummies

Video: Meet Your Master - Getting to Know Your Brain: Crash Course Psychology #4 2024

Video: Meet Your Master - Getting to Know Your Brain: Crash Course Psychology #4 2024
Anonim

De fundamentele elementen van het big data-platform beheren gegevens op nieuwe manieren in vergelijking met de traditionele relationele database. Dit komt door de behoefte aan schaalbaarheid en hoge prestaties die vereist zijn om zowel gestructureerde als ongestructureerde gegevens te beheren.

Componenten van het big data-ecosysteem, variërend van Hadoop tot NoSQL DB, MongoDB, Cassandra en HBase, hebben allemaal hun eigen aanpak voor het extraheren en laden van gegevens. Als gevolg hiervan moeten uw teams mogelijk nieuwe vaardigheden ontwikkelen om het integratieproces op al deze platforms te beheren. Veel best practices voor datamanagement van uw bedrijf zullen echter nog belangrijker worden naarmate u de wereld van big data betreedt.

Hoewel big data een nieuw niveau van integratiecomplexiteit introduceert, zijn de fundamentele basisbeginselen nog steeds van toepassing. Uw bedrijfsdoelstelling moet gericht zijn op het leveren van kwaliteit en vertrouwde gegevens aan de organisatie op het juiste moment en in de juiste context.

Om dit vertrouwen te waarborgen, moet u gemeenschappelijke regels opstellen voor de gegevenskwaliteit met de nadruk op nauwkeurigheid en volledigheid van gegevens. Daarnaast hebt u een alomvattende aanpak nodig voor het ontwikkelen van bedrijfsmetadata, het bijhouden van datalijn en governance om de integratie van uw gegevens te ondersteunen.

Tegelijkertijd evolueren traditionele tools voor data-integratie om de toenemende verscheidenheid aan ongestructureerde data en het toenemende volume en de snelheid van big data aan te kunnen. Terwijl traditionele vormen van integratie nieuwe betekenissen krijgen in een grote gegevenswereld, hebben uw integratietechnologieën een gemeenschappelijk platform nodig dat gegevenskwaliteit en profilering ondersteunt.

Om goede zakelijke beslissingen te nemen op basis van big data-analyse, moet deze informatie worden vertrouwd en begrepen op alle niveaus van de organisatie. Hoewel het waarschijnlijk niet duur of tijdrovend zal zijn om zich te veel zorgen te maken over de gegevenskwaliteit in de verkennende fase van een big data-analyse, moeten uiteindelijk kwaliteit en vertrouwen een rol spelen als de resultaten moeten worden opgenomen in het bedrijfsproces.

Informatie moet op een vertrouwde, gecontroleerde, consistente en flexibele manier aan de onderneming worden geleverd, ongeacht de vereisten die specifiek zijn voor afzonderlijke systemen of toepassingen. Om dit doel te bereiken, zijn drie basisprincipes van toepassing:

  • U moet een gemeenschappelijk begrip van gegevensdefinities creëren. In de beginfasen van uw big data-analyse heeft u waarschijnlijk niet hetzelfde niveau van controle over gegevensdefinities als met uw operationele gegevens.Zodra u echter de patronen hebt geïdentificeerd die het meest relevant zijn voor uw bedrijf, hebt u de mogelijkheid nodig om gegevenselementen toe te wijzen aan een gemeenschappelijke definitie.

  • U moet een set dataservices ontwikkelen om de gegevens te kwalificeren en consistent en uiteindelijk betrouwbaar te maken. Wanneer uw ongestructureerde en grote gegevensbronnen zijn geïntegreerd met gestructureerde operationele gegevens, moet u erop kunnen vertrouwen dat de resultaten zinvol zijn.

  • U hebt een gestroomlijnde manier nodig om uw grote gegevensbronnen en recordsystemen te integreren. Om goede beslissingen te nemen op basis van de resultaten van uw big data-analyse, moet u op het juiste moment en met de juiste context informatie verstrekken. Uw big data-integratieproces moet zorgen voor consistentie en betrouwbaarheid.

Om gegevens te integreren in gemengde toepassingsomgevingen, haalt u gegevens op uit de ene gegevensomgeving (bron) naar een andere gegevensomgeving (doel). Extract, transform en load (ETL) -technologieën zijn gebruikt om dit te bereiken in traditionele datawarehouse-omgevingen. De rol van ETL evolueert om nieuwe datamanagementomgevingen zoals Hadoop aan te kunnen.

In een big data-omgeving moet u mogelijk tools combineren die batch-integratieprocessen ondersteunen (via ETL) met real-time integratie en federatie via meerdere bronnen. Een farmaceutisch bedrijf moet bijvoorbeeld gegevens die zijn opgeslagen in zijn Master Data Management (MDM) -systeem combineren met big data-bronnen over medische uitkomsten van drugsgebruik door klanten.

Bedrijven gebruiken MDM om het verzamelen, aggregeren, consolideren en leveren van consistente en betrouwbare gegevens op een gecontroleerde manier in de hele onderneming te vergemakkelijken. Daarnaast worden nieuwe tools zoals Sqoop en Scribe gebruikt om de integratie van big data-omgevingen te ondersteunen. Je vindt ook een toenemende nadruk op het gebruik van extract, load en transform (ELT) -technologieën. Deze technologieën worden hierna beschreven.

De basisprincipes van Big Data Integration - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...