Video: Ángel de Brito se metió de lleno en el mundo íntimo de Flor Jazmín Peña 2024
'Simple' betekent vaak 'elegant' als het gaat om die bouwkundige tekeningen voor dat nieuw herenhuis in Silicon Valley waar je voor hebt gepland wanneer het geld begint te rollen nadat je Hadoop hebt geïmplementeerd. Hetzelfde principe is van toepassing op software-architectuur. Pig bestaat uit twee (count'em, twee) componenten:
-
De taal zelf: Als bewijs dat programmeurs een gevoel voor humor hebben, staat de programmeertaal voor Pig bekend als Pig Latin, een hoog niveau taal waarmee u gegevensverwerkings- en analyseprogramma's kunt schrijven.
-
The Pig Latin compiler: De Pig Latin-compiler converteert de Pig Latin-code naar uitvoerbare code. De uitvoerbare code is in de vorm van MapReduce-taken of kan een proces uitlokken waarbij een virtuele Hadoop-instantie wordt gemaakt om de Pig-code op één knooppunt uit te voeren.
De opeenvolging van MapReduce-programma's maakt Pig-programma's in staat parallel gegevensverwerking en -analyse uit te voeren, gebruikmakend van Hadoop MapReduce en HDFS. Het uitvoeren van de Pig-taak in de virtuele Hadoop-instantie is een nuttige strategie voor het testen van uw Pig-scripts.
De figuur laat zien hoe Pig zich verhoudt tot het Hadoop-ecosysteem.
Varkensprogramma's kunnen op MapReduce v1 of MapReduce v2 worden uitgevoerd zonder dat er code wordt gewijzigd, ongeacht de modus waarin uw cluster wordt uitgevoerd. Pig-scripts kunnen echter ook worden uitgevoerd met de Tez-API. Apache Tez biedt een efficiënter uitvoeringsschema dan MapReduce. Met YARN kunnen toepassingskaders anders dan MapReduce (zoals Tez) op Hadoop worden uitgevoerd. De bijenkorf kan ook tegen het Tez-raamwerk lopen.