Huis Persoonlijke financiën Prestaties zijn belangrijk in Big Data-architectuurbeheer - dummies

Prestaties zijn belangrijk in Big Data-architectuurbeheer - dummies

Inhoudsopgave:

Video: Chopping 20 rows of corn with Kemper 2024

Video: Chopping 20 rows of corn with Kemper 2024
Anonim

Uw big data-architectuur moet ook presteren in samenwerking met de ondersteunende infrastructuur van uw organisatie. U zou bijvoorbeeld geïnteresseerd kunnen zijn in het runnen van modellen om te bepalen of het veilig is om te boren naar olie in een offshore gebied, gegeven real-time gegevens van temperatuur, saliniteit, sedimentresuspensie en een groot aantal andere biologische, chemische en fysische eigenschappen van de waterkolom.

Het kan enkele dagen duren om dit model uit te voeren met een traditionele serverconfiguratie. Het gebruik van een model voor gedistribueerd computergebruik heeft echter enkele minuten in beslag genomen.

Prestaties kunnen ook bepalen welk soort database u zou gebruiken. In sommige situaties wilt u bijvoorbeeld begrijpen hoe twee zeer verschillende gegevenselementen met elkaar in verband staan. Wat is de relatie tussen buzz op een sociaal netwerk en de omzetgroei? Dit is niet de typische query die u zou kunnen vragen van een gestructureerde, relationele database.

Een grafische database kan een betere keuze zijn, omdat deze specifiek is ontworpen om de "knooppunten" of entiteiten te scheiden van de "eigenschappen" of de informatie die die entiteit definieert, en de "rand" of relatie tussen knooppunten en eigenschappen. Het gebruik van de juiste database zal ook de prestaties verbeteren. Meestal wordt de graafgegevensbank gebruikt in wetenschappelijke en technische toepassingen.

Andere belangrijke operationele benaderingen van databases zijn kolomvormige databases die informatie efficiënt in kolommen opslaan in plaats van rijen. Deze aanpak leidt tot snellere prestaties omdat de invoer / uitvoer extreem snel is. Wanneer geografische gegevensopslag deel uitmaakt van de vergelijking, is een ruimtelijke database geoptimaliseerd voor het opslaan en opvragen van gegevens op basis van hoe objecten in de ruimte gerelateerd zijn.

Big data-services en -tools organiseren

Niet alle gegevens die organisaties gebruiken, zijn operationeel. Een groeiend aantal gegevens is afkomstig van een verscheidenheid aan bronnen die niet zo georganiseerd of ongecompliceerd zijn, zoals gegevens die afkomstig zijn van machines of sensoren en enorme openbare en privégegevensbronnen. In het verleden waren de meeste bedrijven niet in staat om deze enorme hoeveelheid gegevens vast te leggen of op te slaan. Het was gewoon te duur of te overweldigend.

Zelfs als bedrijven de gegevens konden vastleggen, beschikten ze niet over de tools om er iets aan te doen. Zeer weinig tools kunnen deze enorme hoeveelheden gegevens bevatten. De gereedschappen die er waren, waren complex in gebruik en leverden geen resultaten op in een redelijk tijdsbestek.

Uiteindelijk werden degenen die echt de enorme inspanning wilden doen om deze gegevens te analyseren gedwongen om met snapshots van gegevens te werken.Dit heeft het ongewenste effect dat belangrijke gebeurtenissen ontbreken omdat ze zich niet in een bepaalde momentopname bevonden.

MapReduce, Hadoop en Big Table voor big data

Met de evolutie van de computertechnologie is het nu mogelijk om enorme hoeveelheden gegevens te beheren. De prijzen van systemen zijn gedaald en als gevolg daarvan zijn nieuwe technieken voor gedistribueerd computergebruik gangbaar. De echte doorbraak vond plaats als bedrijven als Yahoo!, Google en Facebook kwamen tot het besef dat ze hulp nodig hadden om geld te verdienen met de enorme hoeveelheden gegevens die ze aan het maken waren.

Deze opkomende bedrijven moesten nieuwe technologieën vinden waarmee ze enorme hoeveelheden gegevens bijna in realtime konden opslaan, openen en analyseren, zodat ze konden profiteren van de voordelen van het bezitten van zoveel gegevens over deelnemers in hun netwerken.

Hun resulterende oplossingen transformeren de markt voor gegevensbeheer. Met name de innovaties MapReduce, Hadoop en Big Table bleken de vonken te zijn die leidden tot een nieuwe generatie gegevensbeheer. Deze technologieën pakken een van de meest fundamentele problemen aan: het vermogen om enorme hoeveelheden gegevens efficiënt, kosteneffectief en tijdig te verwerken.

MapReduce

MapReduce is door Google ontworpen als een manier om efficiënt een reeks functies uit te voeren tegen een grote hoeveelheid gegevens in batchmodus. De "map" -component distribueert het programmeringsprobleem of de taken over een groot aantal systemen en behandelt de plaatsing van de taken. Het balanceert ook de belasting en beheert het herstel van fouten. Een andere functie genaamd "verminderen" aggregeert alle elementen weer samen om een ​​resultaat te leveren.

Big Table

Big Table is door Google ontwikkeld als een gedistribueerd opslagsysteem dat is bedoeld voor het beheren van zeer schaalbare, gestructureerde gegevens. Gegevens zijn georganiseerd in tabellen met rijen en kolommen. In tegenstelling tot een traditioneel relationeel databasemodel is Big Table een schaars, gedistribueerd, persistent multidimensionaal gesorteerde kaart. Het is bedoeld om grote hoeveelheden gegevens op te slaan op basis van commodity-servers.

Hadoop

Hadoop is een door Apache beheerd softwareraamwerk afgeleid van MapReduce en Big Table. Hadoop maakt het mogelijk applicaties op basis van MapReduce uit te voeren op grote clusters van commodity-hardware. Het project is de basis voor de computerarchitectuur die Yahoo! zaken doen. Hadoop is ontworpen om de gegevensverwerking over meerdere knooppunten te parallelliseren om berekeningen te versnellen en latentie te verbergen.

Er zijn twee belangrijke componenten van Hadoop: een enorm schaalbaar gedistribueerd bestandssysteem dat petabytes aan gegevens kan ondersteunen en een enorm schaalbare MapReduce-engine die de resultaten in batch berekent.

Prestaties zijn belangrijk in Big Data-architectuurbeheer - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...