Video: Hoe maak je een Tomahawk Apache Battle Axe - Easy Tutorials 2024
Apache Oozie is opgenomen in elke grote Hadoop-distributie, inclusief Apache Bigtop. Installeer de Oozie-server in uw Hadoop-cluster op een randknooppunt, waar u ook andere clienttoepassingen tegen de gegevens van het cluster uitvoert, zoals weergegeven.
Randknooppunten zijn ontworpen als een gateway voor het externe netwerk naar het Hadoop-cluster. Dit maakt ze ideaal voor datatransfertechnologieën (bijvoorbeeld Flume), maar ook voor clienttoepassingen en andere applicatie-infrastructuur zoals Oozie. Oozie heeft geen dedicated server nodig en kan gemakkelijk naast andere services worden gebruikt die bij uitstek geschikt zijn voor edge-nodes, zoals Pig and Hive.
Nadat Oozie is geïmplementeerd, bent u klaar om de Oozie-server te starten. De infrastructuur van Oozie is geïnstalleerd in de directory $ OOZIE_HOME. Vanaf daar start je de oozie-start. sh opdracht om de server te starten. (Zoals je zou verwachten, is het stoppen van de server het typen van oozie-stop. Sh.) Je kunt de status van je Oozie-instantie testen door de opdracht
oozie admin -status
uit te voeren nadat je de Oozie-server hebt geïmplementeerd en gestart, kunt u uw verschillende workflow-, coördinatie- of bundeltaken catalogiseren en uitvoeren. Bij het werken met uw taken slaat Oeizie de catalogusdefinities op - de gegevens die alle Oozie-objecten beschrijven (workflow-, coördinator- en bundeljobs) - evenals hun toestanden in een speciale database.
Standaard is Oozie geconfigureerd om de ingebouwde Derby-database te gebruiken, maar u kunt MySQL, Oracle of PostgreSQL gebruiken als dat nodig is.
U hebt vier opties voor interactie met de Oozie-server:
-
De Java-API: Deze optie is handig in situaties waarin u uw eigen planningscode in Java-toepassingen hebt en u de uitvoering van uw Java-besturingssysteem moet regelen. Oozie-workflows, -coördinatoren of -bundels vanuit uw toepassing.
-
De REST API: Nogmaals, deze optie werkt goed in die gevallen waarin u uw eigen planningscode wilt gebruiken als basis voor uw Oozie-workflows, -coördinatoren of -bundels, of als u wil je je eigen interface bouwen of een bestaande uitbreiden voor het beheer van de Oozie-server.
-
Command Line Interface (CLI): Het is de traditionele Linux-opdrachtregelinterface voor Oozie.
-
De Oozie Webconsole: Oké, misschien kun je hier niet veel interactie hebben, maar de Oozie Web Console geeft je een (alleen-lezen) weergave van de status van de Oozie-server, die handig voor het controleren van uw Oozie-taken.
Hue, een Hadoop-beheerinterface, biedt een andere tool voor het werken met Oozie.Oozie-workflows, -coördinatoren en -bundels worden allemaal gedefinieerd met behulp van XML, wat lastig kan zijn om te bewerken, vooral voor complexe situaties. Hue biedt een GUI-ontwerptool om werkstromen en andere Oozie-objecten grafisch te maken.
Onder de covers heeft Oozie een ingebedde Tomcat-webserver, die de invoer en uitvoer verwerkt.