Inhoudsopgave:
- Hadoop-implementatie in één rack
- Hadoop-implementatie met drie racks
- Grootschalige Hadoop-implementatie
Video: Hadoop 3 New Features | Hadoop Tutorial Videos | Mr. Srinivas 2024
Hadoop-implementatie in één rack
Een implementatie met één rack is een ideaal startpunt voor een Hadoop-cluster.
Hier is het cluster redelijk autonoom, maar omdat het nog steeds relatief weinig slaafknopen heeft, zijn de echte voordelen van de veerkracht van Hadoop nog niet duidelijk.
Hadoop-implementatie met drie racks
Een cluster van middelmatige grootte heeft meerdere racks, waarbij de drie masterknooppunten over de racks zijn verdeeld.
De veerkracht van Hadoop begint duidelijk te worden: zelfs als een volledig rack zou falen (bijvoorbeeld beide ToR-switches in een enkel rack), zou het cluster nog steeds functioneren, zij het op een lager prestatieniveau. Een slaafknooppuntfout is nauwelijks merkbaar.
Grootschalige Hadoop-implementatie
In grotere clusters met veel racks, zoals het getoonde voorbeeld, is de vereiste netwerkarchitectuur behoorlijk ingewikkeld.
Ongeacht het aantal racks waar de Hadoop-clusters naar toe groeien, moeten de slaafknooppunten vanuit elk rek efficiënt kunnen praten? naar elke master node.
Naarmate het aantal slaafknopen stijgt tot het punt waarop u meer dan drie racks hebt, zijn extra racks alleen samengesteld uit slave-knooppunten, behalve de ToR-switches. Als u HBase zwaar gebruikt in uw cluster, kunt u masterknooppunten toevoegen om extra HMaster- en Zookeeper-services te hosten.
Als u afstudeert naar een echt enorme schaal, waar u honderden slave-knooppunten hebt, moet u mogelijk de HDFS-federatiefunctionaliteit gebruiken zodat grote delen van uw gegevenssets worden beheerd door verschillende NameNode-services.
Voor elke extra Active NameNode hebt u een overeenkomend Standby NameNode en twee hoofdknooppunten nodig om deze servers te hosten. Met HDFS-federatie is de lucht echt de limiet in termen van hoe ver je je clusters kunt schalen.
Vorige Volgende