Huis Persoonlijke financiën De architectuur van Apache Hive - dummies

De architectuur van Apache Hive - dummies

Video: Hadoop and R 2024

Video: Hadoop and R 2024
Anonim

Terwijl je de elementen van Apache Hive bekijkt, kun je onderaan zien dat Hive bovenop het Hadoop Distributed File System (HDFS) zit) en MapReduce-systemen.

In het geval van MapReduce geven de figuren zowel de Hadoop 1- als Hadoop 2-componenten weer. Met Hadoop 1 worden Hive-query's geconverteerd naar MapReduce-code en uitgevoerd met de infrastructuur MapReduce v1 (MRv1), zoals de JobTracker en TaskTracker.

Met Hadoop 2 heeft YARN middelenbeheer en planning ontkoppeld van het MapReduce-raamwerk. Hive-query's kunnen nog steeds worden geconverteerd naar MapReduce-code en uitgevoerd, nu met MapReduce v2 (MRv2) en de YARN-infrastructuur.

Er is een nieuw framework in ontwikkeling genaamd Apache Tez, dat is ontworpen om de prestaties van Hive voor query's in batchstijlen te verbeteren en kleinere interactieve (ook wel real-time ) query's te ondersteunen. Op het moment van schrijven is het Apache Tez-project nog steeds in incubatie en heeft het nog geen productie-ready release.

Als het u helpt te visualiseren hoe alle stukjes bij elkaar passen, denk dan aan de HDFS- en MapReduce-systemen als onderdelen van het Apache Hadoop-besturingssysteem, met Hive - evenals andere componenten, zoals HBase - als functies of toepassingen op een hoger niveau. (Je ziet een algemeen thema naar voren komen: HDFS biedt de opslag en MapReduce biedt de parallelle verwerkingscapaciteit voor functies op een hoger niveau binnen het Hadoop-ecosysteem.)

Als u het diagram omhoog gaat, vindt u de Hive Driver, die de HiveQL compileert, optimaliseert en uitvoert. De Hive Driver kan ervoor kiezen om HiveQL-instructies en opdrachten lokaal uit te voeren of een MapReduce-taak uit te voeren, afhankelijk van de taak die voorhanden is. De Hive Driver bewaart tabelmetadata in de metastore en zijn database.

U hebt waarschijnlijk enige vertrouwdheid met SQL en het relationele databasemodel uit de wereld van RDBMSs. Een tabel of relatie is samengesteld uit verticale kolommen en horizontale rijen. Cellen worden opgeslagen waar de rijen en kolommen elkaar kruisen. Als u niet vertrouwd bent met SQL en het relationele databasemodel, kunt u nuttige leerbronnen vinden met behulp van uw favoriete zoekmachine.

Standaard bevat Hive de Apache Derby RDBMS die is geconfigureerd met de metastore in de zogenaamde ingebedde modus. Ingesloten modus betekent dat de Hive Driver, de metastore en Apache Derby allemaal in één Java Virtual Machine (JVM) worden uitgevoerd.

Deze configuratie is prima voor leerdoeleinden, maar de ingesloten modus kan slechts één enkele Hive-sessie ondersteunen, dus wordt deze normaal niet gebruikt in productieomgevingen met meerdere gebruikers.Er zijn twee andere modi: lokaal en extern - die meerdere Hive-sessies in productieomgevingen beter kunnen ondersteunen. U kunt ook elk RDBMS configureren dat compatibel is met de Java Database Connectivity (JDBC) Application Programming Interface (API) -suite. (Voorbeelden hiervan zijn MySQL en DB2.)

De sleutel tot applicatieondersteuning is de Hive Thrift Server, waarmee een uitgebreide set clients toegang heeft tot het Hive-subsysteem. De opensource SQuirreL SQL-client is als voorbeeld opgenomen. Het belangrijkste punt is dat elke JDBC-compatibele applicatie toegang kan krijgen tot Hive via het gebundelde JDBC-stuurprogramma.

Dezelfde verklaring is van toepassing op clients die voldoen aan Open Database Connectivity (ODBC). UnixODBC en het isql-hulpprogramma, bijvoorbeeld, worden meestal gebundeld met Linux en geven toegang tot Hive vanaf externe Linux-clients.

Als u bovendien Microsoft Excel gebruikt, zult u blij zijn te weten dat u Hive kunt gebruiken nadat u het Microsoft ODBC-stuurprogramma op uw clientsysteem hebt geïnstalleerd. Ten slotte, als je toegang tot Hive nodig hebt vanuit andere programmeertalen dan Java (bijvoorbeeld PHP of Python), is Apache Thrift het antwoord. Apache Thrift-clients maken via de Hive Thrift Server verbinding met Hive, net zoals de JDBC- en ODBC-clients.

Om verder te gaan met de Hive-architectuurtekening, houd er rekening mee dat Hive een opdrachtregelinterface (CLI) bevat, waar u een Linux-terminalvenster kunt gebruiken om query's en beheeropdrachten rechtstreeks naar de Hive Driver uit te voeren. Als een grafische benadering meer uw snelheid is, is er ook een handige webinterface zodat u via uw favoriete browser toegang hebt tot uw door Hive beheerde tabellen en gegevens.

Er is nog een webbrowsertechnologie bekend als Hue die een grafische gebruikersinterface (GUI) biedt voor Apache Hive. Sommige Hadoop-gebruikers hebben graag een GUI tot hun beschikking in plaats van alleen een opdrachtregelinterface (CLI). Naast Hive ondersteunt Hue ook andere belangrijke Hadoop-technologieën zoals HDFS, MapReduce / YARN, HBase, Zookeeper, Oozie, Pig en Sqoop. Je zult de naam van Hue's Apache Hive GUI leuk vinden - het heet Bijenwas.

De architectuur van Apache Hive - dummies

Bewerkers keuze

Tien Helpbronnen voor Junos OS - dummies

Tien Helpbronnen voor Junos OS - dummies

Dit is een top-tien lijst met bronnen die u moet zoeken meer informatie over softwarebewerkingen, training en ondersteuning voor Junos - alle extra details die u mogelijk nodig heeft om Junos OS te kunnen configureren en bedienen in uw eigen netwerkimplementaties. CLI Help-commando's Bent u op zoek naar meer achtergrondinformatie over hoe een bepaalde functie ...

De functie van de drie vlakken van Junos netwerk OS - dummies

De functie van de drie vlakken van Junos netwerk OS - dummies

De architectuur van de Junos opererende systeem verdeelt de functies van besturing, services en doorsturen op verschillende niveaus. Elk van de vlakken van Junos OS biedt een kritieke set van functionaliteit in de werking van het netwerk. Besturingsvlak van het Junos-netwerkbesturingssysteem (NOS) Alle functies van het besturingsvlak lopen op ...

De basisprincipes van BGP-routebealing - dummy's

De basisprincipes van BGP-routebealing - dummy's

Het configureren van Border Gateway Protocol (BGP) kan nogal lastig zijn, vooral met grote aantallen peersessies die handmatig moeten worden geconfigureerd. In feite kan in een groot netwerk de full-mesh-vereiste voor IBGP een provisioning-nachtmerrie zijn. BGP's antwoord op de IBGP-paring-configuratie-nachtmerrie die het volledige maaswerk is, wordt routeberefening genoemd. Route ...

Bewerkers keuze

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Als de allerbeste locatie op het web staat op de pagina een van de zoekmachines, je moet de SEO-elementen kennen die je daar kunnen brengen. Een goede plek om te beginnen is met zoekwoorden. Zoekmachines gebruiken geavanceerde processen om zoekwoordgebruik en andere factoren te categoriseren en analyseren om erachter te komen ...

Persberichten als bron van SEO-inhoud - dummies

Persberichten als bron van SEO-inhoud - dummies

Het leuke aan persberichten is dat u ze zonder toestemming op uw website kunt gebruiken, en sommige zullen al voor de zoekmachine zijn geoptimaliseerd. Het doel van een persbericht is om het uit te sturen en te zien wie het ophaalt. U hoeft geen contact op te nemen met de eigenaar van het persbericht, omdat ...

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Zelfs de domeinnaam van uw site moet geoptimaliseerd voor zoekmachines. Zoekmachines lezen uniforme resource locators (URL's), op zoek naar sleutelwoorden erin. Bijvoorbeeld als u een website heeft met de domeinnaam knaagdierracen. com en iemand zoekt Google op knaagdierenraces, Google ziet rodent-racing als een wedstrijd; omdat er een streepje verschijnt tussen de twee ...

Bewerkers keuze

Praxis Elementair onderwijs Examen-Economie - dummies

Praxis Elementair onderwijs Examen-Economie - dummies

U zult enkele basisconcepten van de economie voor de Praxis moeten kennen Elementair onderwijs examen. Elementaire economie onderzoekt de wens voor, de productie van en de verkoop en het gebruik van geld, zowel lokaal als wereldwijd. Het onderwijzen van economie omvat concepten zoals behoeften versus behoeften, kosten en meer tot nadenken stemmende onderwerpen, zoals de volgende: ...

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Het Praxis basisonderwijs: Curriculum, instructie en beoordeling examen (5017) bestrijkt een breed scala van wat u moet weten over basisonderwijs. Als u het Praxis Elementary Education: Content Knowledge-examen (5018) neemt, moet u zich ervan bewust zijn dat het de dekking beperkt tot de inhoud van de vier hoofdonderwerpen die een elementaire leraar is ...

Praxis Core For Dummies Cheat Sheet - dummies

Praxis Core For Dummies Cheat Sheet - dummies

Voordat je te opgewonden raakt, begrijp dat de informatie die volgt niet klopt eigenlijk niet over het bedriegen van de Praxis. Het gaat echt meer om de meest efficiënte manieren om je voor te bereiden op het examen. Maar "voorbereidingsblad" heeft niet helemaal dezelfde reden. Trouwens, vals spelen is niet nodig als je weet wat je aan het doen bent, en ...