Huis Persoonlijke financiën Het MapReduce Programming Paradigm - dummies

Het MapReduce Programming Paradigm - dummies

Video: SpatialHadoop: MapReduce Processing of Spatial Data in Hadoop 2024

Video: SpatialHadoop: MapReduce Processing of Spatial Data in Hadoop 2024
Anonim

MapReduce is een programmeerparadigma dat is ontworpen om parallelle gedistribueerde verwerking van grote sets van data, converteren naar sets van tuples, en dan die tuples combineren en reduceren tot kleinere sets van tuples. In termen van de leek was MapReduce ontworpen om big data te nemen en parallelle gedistribueerde computing te gebruiken om big data om te zetten in kleine of normale gegevens.

Parallel gedistribueerde verwerking verwijst naar een krachtig raamwerk waarin grote hoeveelheden gegevens zeer snel worden verwerkt door verwerkingstaken te distribueren over clusters van commodity-servers. Met betrekking tot MapReduce verwijzen tuples naar sleutel / waarde-paren waarmee gegevens worden gegroepeerd, gesorteerd en verwerkt.

MapReduce-taken werken via de kaart en verminderen procesbewerkingsreeksen op een gedistribueerde set servers. In de kaarttaak delegeert u uw gegevens naar sleutel / waarde-paren, transformeert u deze en filtert u deze. Vervolgens wijst u de gegevens toe aan knooppunten voor verwerking.

In taak verlagen, aggregeert u die gegevens tot kleinere datasets. Gegevens uit de stap Minder worden getransformeerd naar een standaard sleutelwaarde-indeling - waarbij de -sleutel fungeert als de record-ID en de -waarde de waarde is die wordt geïdentificeerd door de sleutel. De berekeningsknooppunten van de clusters verwerken de kaart en verminderen taken die door de gebruiker zijn gedefinieerd. Dit werk wordt gedaan in overeenstemming met de volgende twee stappen:

  1. Breng de gegevens in kaart.

    De binnenkomende gegevens moeten eerst worden gedelegeerd in sleutelwaardeparen en worden onderverdeeld in fragmenten, die vervolgens worden toegewezen aan toewijzingstaken. Elk computercluster - een groep knooppunten die met elkaar zijn verbonden en een gedeelde computertaak uitvoeren - krijgt een aantal kaarttaken toegewezen, die vervolgens worden verdeeld over de knooppunten.

    Na verwerking van de sleutel / waarde-paren, worden tussenliggende sleutel / waarde-paren gegenereerd. De tussenliggende sleutel / waarde-paren worden gesorteerd op hun sleutelwaarden en deze lijst is verdeeld in een nieuwe reeks fragmenten. Wat telt voor deze nieuwe fragmenten, het zal hetzelfde zijn als het aantal taken verminderen.

  2. Verminder de gegevens.

    Aan elke taak voor verkleinen is een fragment toegewezen. De taak reduceren verwerkt eenvoudigweg het fragment en produceert een uitvoer, die ook een sleutel / waarde-paar is. Verkleinde taken worden ook verdeeld over de verschillende knooppunten van het cluster. Nadat de taak is voltooid, wordt de laatste uitvoer naar een bestandssysteem geschreven.

Kortom, u kunt snel en efficiënt naar beneden klappen en een groot volume, snelheid en verscheidenheid aan gegevens beginnen te begrijpen door kaarten te gebruiken en taken te verkleinen om uw gegevens te taggen met (sleutel, waarde) paren en vervolgens te verkleinen die paren in kleinere gegevenssets door aggregatiebewerkingen - bewerkingen die meerdere waarden uit een gegevensreeks combineren tot één waarde.Een diagram van de MapReduce-architectuur is hier te vinden.

Als uw gegevens niet geschikt zijn om te worden getagd en verwerkt via sleutels, waarden en aggregatie, en vervolgens in het algemeen in kaart te brengen, voldoet dit niet aan uw behoeften.

Als u MapReduce gebruikt als onderdeel van een Hadoop-oplossing, wordt de laatste uitvoer geschreven naar het Hadoop Distributed File System (HDFS). HDFS is een bestandssysteem dat clusters van commodity-servers bevat die worden gebruikt om big data op te slaan. HDFS maakt big data handling en opslag financieel haalbaar door -de verdeling van opslagtaken over clusters van goedkope commodity-servers.

Het MapReduce Programming Paradigm - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...