Huis Persoonlijke financiën Het belang van MapReduce in Hadoop - dummies

Het belang van MapReduce in Hadoop - dummies

Video: Willem Bouten: big data onderzoeken dankzij high tech rugzakjes van vogels 2024

Video: Willem Bouten: big data onderzoeken dankzij high tech rugzakjes van vogels 2024
Anonim

Voor het grootste deel van de geschiedenis van Hadoop is MapReduce het enige spel in de stad als het gaat om gegevensverwerking. De beschikbaarheid van MapReduce is de reden voor het succes van Hadoop en tegelijkertijd een belangrijke factor geweest bij het beperken van verdere acceptatie.

MapReduce maakt ervaren programmeurs in staat om gedistribueerde applicaties te schrijven zonder zich zorgen te hoeven maken over de onderliggende gedistribueerde computerinfrastructuur. Dit is een zeer grote deal: Hadoop en het MapReduce-framework hanteren allerlei vormen van complexiteit die toepassingsontwikkelaars niet hoeven aan te pakken.

Bijvoorbeeld: de mogelijkheid om het cluster transparant uit te schalen door middel van het toevoegen van knooppunten en de automatische failover van zowel gegevensopslag als gegevensverwerkingssubsystemen gebeurt met nul impact op applicaties.

De keerzijde van de medaille is dat hoewel MapReduce een enorme hoeveelheid complexiteit verbergt, je het je niet kunt veroorloven om te vergeten wat het is: een interface voor parallel programmeren. Dit is een geavanceerde vaardigheid - en een barrière voor een bredere acceptatie. Er zijn eenvoudigweg nog niet veel programmeurs van MapReduce en niet iedereen heeft de vaardigheid om het onder de knie te krijgen.

In de vroege dagen van Hadoop (Hadoop 1 en eerder), kon je alleen MapReduce-applicaties uitvoeren op je clusters. In Hadoop 2 veranderde de YARN-component dat allemaal door resourcemanagement en planning uit het MapReduce-framework over te nemen en een generieke interface te bieden om applicaties te laten draaien op een Hadoop-cluster.

Kort gezegd betekent dit dat MapReduce nu slechts een van de vele toepassingskaders is die u kunt gebruiken om applicaties voor Hadoop te ontwikkelen en uit te voeren. Hoewel het zeker mogelijk is om applicaties uit te voeren met andere frameworks op Hadoop, betekent dit niet dat we MapReduce kunnen vergeten.

MapReduce is momenteel het enige voor de productie geschikte kader voor gegevensverwerking dat beschikbaar is voor Hadoop. Hoewel andere frameworks uiteindelijk beschikbaar zullen zijn, heeft MapReduce bijna een decennium van volwassenheid in handen (met bijna 4.000 JIRA-issues voltooid, waarbij honderden ontwikkelaars betrokken zijn, als je het op de hoogte houdt).

Er is geen twijfel mogelijk: MapReduce is Hadoop's meest volwassen framework voor gegevensverwerking. Bovendien is er nu een aanzienlijke hoeveelheid MapReduce-code in gebruik die waarschijnlijk binnenkort niet beschikbaar zal zijn. Lang verhaal kort: MapReduce is een belangrijk onderdeel van het Hadoop-verhaal.

De Apache Hive- en Apache Pig-projecten zijn erg populair omdat het gemakkelijker toegangspoorten zijn voor gegevensverwerking op Hadoop. Voor veel problemen, vooral de soorten die u kunt oplossen met SQL, Hive en Pig zijn uitstekende hulpmiddelen.Maar voor een bredere taak, zoals statistische verwerking of tekstextractie, en vooral voor het verwerken van ongestructureerde gegevens, moet u MapReduce gebruiken.

Het belang van MapReduce in Hadoop - dummies

Bewerkers keuze

Tien Helpbronnen voor Junos OS - dummies

Tien Helpbronnen voor Junos OS - dummies

Dit is een top-tien lijst met bronnen die u moet zoeken meer informatie over softwarebewerkingen, training en ondersteuning voor Junos - alle extra details die u mogelijk nodig heeft om Junos OS te kunnen configureren en bedienen in uw eigen netwerkimplementaties. CLI Help-commando's Bent u op zoek naar meer achtergrondinformatie over hoe een bepaalde functie ...

De functie van de drie vlakken van Junos netwerk OS - dummies

De functie van de drie vlakken van Junos netwerk OS - dummies

De architectuur van de Junos opererende systeem verdeelt de functies van besturing, services en doorsturen op verschillende niveaus. Elk van de vlakken van Junos OS biedt een kritieke set van functionaliteit in de werking van het netwerk. Besturingsvlak van het Junos-netwerkbesturingssysteem (NOS) Alle functies van het besturingsvlak lopen op ...

De basisprincipes van BGP-routebealing - dummy's

De basisprincipes van BGP-routebealing - dummy's

Het configureren van Border Gateway Protocol (BGP) kan nogal lastig zijn, vooral met grote aantallen peersessies die handmatig moeten worden geconfigureerd. In feite kan in een groot netwerk de full-mesh-vereiste voor IBGP een provisioning-nachtmerrie zijn. BGP's antwoord op de IBGP-paring-configuratie-nachtmerrie die het volledige maaswerk is, wordt routeberefening genoemd. Route ...

Bewerkers keuze

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Als de allerbeste locatie op het web staat op de pagina een van de zoekmachines, je moet de SEO-elementen kennen die je daar kunnen brengen. Een goede plek om te beginnen is met zoekwoorden. Zoekmachines gebruiken geavanceerde processen om zoekwoordgebruik en andere factoren te categoriseren en analyseren om erachter te komen ...

Persberichten als bron van SEO-inhoud - dummies

Persberichten als bron van SEO-inhoud - dummies

Het leuke aan persberichten is dat u ze zonder toestemming op uw website kunt gebruiken, en sommige zullen al voor de zoekmachine zijn geoptimaliseerd. Het doel van een persbericht is om het uit te sturen en te zien wie het ophaalt. U hoeft geen contact op te nemen met de eigenaar van het persbericht, omdat ...

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Zelfs de domeinnaam van uw site moet geoptimaliseerd voor zoekmachines. Zoekmachines lezen uniforme resource locators (URL's), op zoek naar sleutelwoorden erin. Bijvoorbeeld als u een website heeft met de domeinnaam knaagdierracen. com en iemand zoekt Google op knaagdierenraces, Google ziet rodent-racing als een wedstrijd; omdat er een streepje verschijnt tussen de twee ...

Bewerkers keuze

Praxis Elementair onderwijs Examen-Economie - dummies

Praxis Elementair onderwijs Examen-Economie - dummies

U zult enkele basisconcepten van de economie voor de Praxis moeten kennen Elementair onderwijs examen. Elementaire economie onderzoekt de wens voor, de productie van en de verkoop en het gebruik van geld, zowel lokaal als wereldwijd. Het onderwijzen van economie omvat concepten zoals behoeften versus behoeften, kosten en meer tot nadenken stemmende onderwerpen, zoals de volgende: ...

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Het Praxis basisonderwijs: Curriculum, instructie en beoordeling examen (5017) bestrijkt een breed scala van wat u moet weten over basisonderwijs. Als u het Praxis Elementary Education: Content Knowledge-examen (5018) neemt, moet u zich ervan bewust zijn dat het de dekking beperkt tot de inhoud van de vier hoofdonderwerpen die een elementaire leraar is ...

Praxis Core For Dummies Cheat Sheet - dummies

Praxis Core For Dummies Cheat Sheet - dummies

Voordat je te opgewonden raakt, begrijp dat de informatie die volgt niet klopt eigenlijk niet over het bedriegen van de Praxis. Het gaat echt meer om de meest efficiënte manieren om je voor te bereiden op het examen. Maar "voorbereidingsblad" heeft niet helemaal dezelfde reden. Trouwens, vals spelen is niet nodig als je weet wat je aan het doen bent, en ...