De Hadoop-omgeving instellen met Apache Bigtop - dummies

Als u vertrouwd bent met het werken met VM's en Linux, kunt u Bigtop op een andere VM installeren dan wordt aanbevolen. Als je echt gedurfd bent en de hardware hebt, ga je gang en probeer Bigtop te installeren op een cluster van machines in volledig gedistribueerde modus!

Stap 1: een VM downloaden

Hadoop draait op alle populaire Linux-distributies, dus u hebt een Linux VM nodig. Er is een gratis beschikbare (en legale!) CentOS 6-afbeelding beschikbaar.

U hebt een 64-bits besturingssysteem op uw laptop nodig om deze VM uit te voeren. Hadoop heeft een 64-bits omgeving nodig.

Nadat u de VM hebt gedownload, pakt u deze uit het gedownloade zip-bestand in de doelmap. Zorg ervoor dat u ongeveer 50 GB aan beschikbare ruimte hebt aangezien Hadoop en uw voorbeeldgegevens deze nodig hebben.

Als u nog geen VM-speler hebt, kunt u er een gratis downloaden.

Nadat je je VM-speler hebt ingesteld, open je de speler, ga je naar Bestand → Openen en ga je naar de map waar je je Linux-VM hebt uitgepakt. Zoek naar een bestand met de naam en selecteer het. U zult informatie zien over hoeveel processors en hoeveel geheugen het zal gebruiken. Ontdek hoeveel geheugen uw computer heeft en wijs de helft ervan toe aan de VM om te gebruiken. Hadoop heeft veel geheugen nodig.

Als je klaar bent, klik je op de knop Afspelen en je Linux-instantie wordt gestart. Je zult veel berichten zien voorbij vliegen terwijl Linux opstart en je komt bij een inlogscherm. De gebruikersnaam is al ingesteld op "Tom. "Specificeer het wachtwoord als" tomtom "en meld u aan.

Stap 2: Bigtop downloaden

Klik vanuit uw Linux VM met de rechtermuisknop op het scherm en selecteer Openen in terminal in het contextuele menu dat verschijnt. Hiermee wordt een Linux-terminal geopend, waar u opdrachten kunt uitvoeren. Klik in de terminal zodat u de cursor kunt zien knipperen en de volgende opdracht kunt invoeren: su -

Er wordt om je wachtwoord gevraagd, dus typ "tomtom" zoals je eerder hebt gedaan. Deze opdracht schakelt de gebruiker naar root, het hoofdaccount voor een Linux-computer - u hebt dit nodig om Hadoop te installeren.

Met je root-toegang (laat de stroom niet op je hoofd vallen), voer je de volgende opdracht uit:

wget -O / etc / yum. repos. d / BigTop. repo

// www. apache. org / dist / bigtop / bigtop-

0. 7. 0 / repos / centos6 / bigtop. repo

De opdracht is in wezen een webverzoek, waarin een specifiek bestand in de URL wordt opgevraagd die u kunt zien en deze naar een specifiek pad schrijft - in dit geval is dat /.

Stap 3: Bigtop installeren

De genieën achter Linux hebben het leven behoorlijk gemakkelijk gemaakt voor mensen die grote softwarepakketten zoals Hadoop moeten installeren.Wat je in de laatste stap downloadde, was niet het hele Bigtop-pakket en al zijn afhankelijkheden. Het was slechts een repositorybestand (met de extensie), die een installatieprogramma vertelt welke softwarepakketten nodig zijn voor de Bigtop-installatie.

Zoals elk groot softwareproduct heeft Hadoop veel voorwaarden, maar u hoeft zich geen zorgen te maken. Een goed ontworpen bestand wijst naar afhankelijkheden en het installatieprogramma is slim genoeg om te zien of ze op uw computer ontbreken en vervolgens te downloaden en te installeren.

Het installatieprogramma dat u hier gebruikt, heet yum, dat u nu in actie kunt zien:

yum install hadoop * mahout * oozie * hbase * hive * tint * varken * dierenverzorger *

Merk op dat u plukken en kiezen de Hadoop-componenten om te installeren. Er zijn een aantal andere componenten beschikbaar in Bigtop, maar dit zijn de enige die u hier zult gebruiken. Omdat de VM een nieuwe Linux-installatie is, heb je veel afhankelijkheden nodig, dus je moet even wachten.

Het yum-installatieprogramma is behoorlijk uitgebreid, zodat je precies kunt zien wat er wordt gedownload en geïnstalleerd om de tijd te doden. Wanneer het installatieproces is voltooid, ziet u een bericht met de melding "Voltooid! "

Stap 4: Hadoop starten

Voordat u begint met het uitvoeren van applicaties op Hadoop, zijn er enkele basisconfiguraties en instellingsmogelijkheden die u moet doen. Hier zijn ze in orde:

Download en installeer Java:

yum install java-1. 7. 0-openjdk-devel. x86_64

Formatteer de NameNode:

sudo / etc / init. d / hadoop-hdfs-namenode start

Start de Hadoop-services voor uw pseudodistributed cluster:

voor i in hadoop-hdfs-namenode hadoop-hdfs-datanode; doe sudo service $ i start; klaar

Maak een submapstructuur in HDFS:

sudo / usr / lib / hadoop / libexec / init-hdfs. sh

Start de YARN-daemons:

sudo-service hadoop-yarn-resourcemanager startsudo-service hadoop-yarn-nodemanager start

En daarmee bent u klaar. Hartelijk gefeliciteerd! U hebt een werkende Hadoop-implementatie geïnstalleerd!

Stap 5: Downloaden van de voorbeeldgegevensverzameling

Om de voorbeeldgegevensset te downloaden, opent u de Firefox-browser vanuit de VM en gaat u naar de dataexpo-pagina.

U hebt niet de volledige gegevensset nodig, dus begin met een jaar, 1987. Wanneer u gaat downloaden, selecteert u de optie Openen met archiefbeheer.

Nadat het bestand is gedownload, pakt u het uit in uw basismap waar u het gemakkelijk kunt vinden. Klik op de knop Uitnemen en selecteer vervolgens de Desktop-map.

Stap 6: De voorbeeldgegevensset kopiëren naar HDFS

Vergeet niet dat uw Hadoop-programma's alleen met gegevens kunnen werken nadat deze in HDFS zijn opgeslagen. Dus wat je nu gaat doen, is het vluchtgegevensbestand voor 1987 kopiëren naar HDFS. Voer de volgende opdracht in:

hdfs dfs -copyFromLocal 1987. csv / user / root

De Hadoop-omgeving instellen met Apache Bigtop - dummies

Inhoudsopgave:

Video: Howto install hadoop on Ubuntu 2024

Stap 1: een VM downloaden

Stap 2: Bigtop downloaden

Stap 3: Bigtop installeren

Stap 4: Hadoop starten

Stap 5: Downloaden van de voorbeeldgegevensverzameling

Stap 6: De voorbeeldgegevensset kopiëren naar HDFS

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon Rebel T3-serie camera's: het scherm met scherminstellingen uitschakelen - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Grammatica controleren in Word 2007 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Bewerkers keuze

Omgaan met de nieuwe Excel 2007-bestandsindelingen - dummies

Ontcijferen Foutwaarden in Excel 2016 Formules - dummies

Bepalen welke gegevens moeten worden weergegeven in uw Excel Financial Model - dummies

Foutwaarden in Excel 2010-formules herkennen - Dummies

Bewerkers keuze

IPhone & iPad Webontwerp voor Dummy's Cheat Sheet - dummies

Lijst- en extensie-eigenschappen van Cascading Style Sheets (CSS) - dummies

Ervoor zorgen dat uw aanbiedingen waardevol zijn voor uw e-mailmarketing Klanten - dummies

Zorg ervoor dat uw e-mailmarketing voldoet aan de spamwetgeving - dummies

Populaire categorieën