Huis Persoonlijke financiën De attributen van HBase - dummies

De attributen van HBase - dummies

Inhoudsopgave:

Video: Dag Sinterklaas - De attributen van Sinterklaas (kledij) 2024

Video: Dag Sinterklaas - De attributen van Sinterklaas (kledij) 2024
Anonim

HBase (Hadoop-database) is een Java-implementatie van Google's BigTable. Google definieert BigTable als een 'schaars, gedistribueerd, persistent multidimensionaal gesorteerde kaart. "Het is een vrij beknopte definitie, maar je zult het er ook over eens zijn dat het een beetje ingewikkeld is. Om de complexiteit van BigTable een beetje af te breken, volgt een bespreking van elk attribuut.

Hbase is beperkt

Zoals je misschien al hebt geraden, is het BigTable gedistribueerde gegevensopslagsysteem ontworpen om aan de eisen van big data te voldoen. Big data-applicaties slaan nu veel gegevens op, maar big data-content is ook vaak variabel. Stel u een traditionele tabel voor in een bedrijfsdatabase met klantcontactinformatie, zoals weergegeven:

Traditionele klantcontactinformatie Tabel

Klant-ID Achternaam Voornaam Tweede voornaam E-mailadres Straatadres
00001 Smith John Timothy 1 Hadoop Lane, NY 11111
00002 Doe Jane NULL NULL 7 HBase Ave, CA 22222

Een bedrijf of persoon kan een volledig gegevensrecord vereisen voor elk van zijn klanten of kiezers. Een goed voorbeeld is uw arts, die al uw contactgegevens nodig heeft om u de juiste zorg te kunnen bieden. Andere bedrijven of individuen hebben mogelijk slechts gedeeltelijke contactgegevens nodig of moeten die informatie mogelijk in de loop van de tijd leren.

Een klantenservicebedrijf kan bijvoorbeeld telefoonoproepen of e-mailberichten verwerken voor serviceaanvragen. Klanten kunnen al dan niet ervoor kiezen om servicebedrijven al hun contactgegevens te geven. Bij elke interactie na verloop van tijd kunnen bedrijven echter meer over hun klanten leren waardoor ze betere service kunnen bieden, bijvoorbeeld door proactieve servicewaarschuwingen uit te geven.

In deze context betekent sparse dat velden in rijen leeg of NULL kunnen zijn maar HBase niet tot stilstand komt. HBase kan het feit aan dat u (nog) niet de middennaam en het e-mailadres kent van Jane Doe, bijvoorbeeld.

Hier is nog een voorbeeld: een database voor het opslaan van satellietbeelden. Het blijkt dat Google BigTable-technologie gebruikt om satellietbeelden van de aarde op te slaan. In bijna alle gevallen, wanneer afbeeldingen worden opgeslagen, worden ook metagegevens ermee opgeslagen.

De metagegevens kunnen het straatadres van de afbeelding bevatten of alleen de breedtegraad en lengtegraad als de afbeelding wordt vastgelegd vanuit de wildernis. De metadata is variabel qua inhoud, dus sommige velden zijn NULL - en dat is OK.

In beide voorbeelden kunnen de verzamelde gegevenssets extreem groot zijn, vooral in het tweede voorbeeld.Imagery-databases worden bijna altijd gemeten in terabytes of soms in petabytes.

HBase is ontworpen voor het opslaan van grote gegevens, maar het is ook ontworpen voor het opslaan van beperkte gegevensrecords zonder kosten. Deze zorg is cruciaal wanneer u big data-applicaties gebruikt! Het opslaan van een paar NULL-records over een miljoen rijen is verspilling, maar probeer je het afval voor te stellen over een reeks van vierhonderd rijen!

Gelukkig was dit een belangrijke overweging voor Google-ontwerpers en de HBase-community. Schaarse gegevens worden ondersteund zonder verspilling van dure opslagruimte.

En daar stopt het niet. Overweeg de kracht van een gegevensloze gegevensopslag. De tabel toont een klassieke klantcontactentabel. Wanneer bedrijven deze tabellen ontwerpen, weten ze van tevoren wat ze willen opslaan. Met andere woorden: het schema is vast ; het wordt gedefinieerd zelfs voordat de eerste byte aan informatie in de tabel wordt opgeslagen.

Wat als er in de loop van de tijd een nieuw veld nodig is voor een klant? Wat dacht je van een Twitter-afhandeling of een nieuw mobiel nummer? U zit blijkbaar vast aan een schema dat niet meer voor u werkt.

Welnu, HBase lost deze uitdaging ook op - u kunt niet alleen velden zonder kosten overslaan als u de gegevens niet hebt, maar ook dynamisch velden (of kolommen in de lokale taal van HBase) toevoegen tijd zonder het schema opnieuw te hoeven ontwerpen of de werking te verstoren.

U kunt HBase dus beschouwen als een gegevensarchief zonder schema; dat wil zeggen, het is vloeiend - je kunt het schema toevoegen, aftrekken of wijzigen terwijl je doorgaat.

HBase is gedistribueerd en persistent

BigTable is een gedistribueerde en permanente gegevensopslag. Persistent betekent eenvoudigweg dat de gegevens die u opslaat in BigTable (en HBase, wat dat betreft) blijven bestaan ​​of blijven nadat uw programma of sessie eindigt. Dat is vrij eenvoudig - aanhoudend betekent dat het blijft bestaan ​​- maar u moet wat meer tijd besteden aan het nadenken over hoe de gegevens aanhouden.

In zijn BigTable-document beschreef Google het gedistribueerde bestandssysteem dat bekend staat als Google File System of GFS. Het lijkt erop dat, net zoals HBase een open source-implementatie van BigTable is, HDFS een open source-implementatie van GFS is.

Standaard gebruikt HBase HDFS om de gegevens naar schijfopslag te houden. Hoewel andere gedistribueerde datastores kunnen worden gebruikt met HBase, maakt de overgrote meerderheid van de HBase-installaties gebruik van HDFS. Dit is volkomen logisch gezien HBase de "Hadoop-database" is - hey, het is in de naam ingebouwd, in hemelsnaam.

HDFS is een belangrijke enabling technology, niet alleen voor Hadoop maar ook voor HBase. Door gegevens in HDFS op te slaan, biedt HBase betrouwbaarheid, beschikbaarheid, naadloze schaalbaarheid, hoge prestaties en nog veel meer - alles op kosteneffectieve gedistribueerde servers!

HBase heeft een multidimensionale gesorteerde kaart

Uitgaand van de basis, is een kaart (ook bekend als een associatieve array ) een abstracte verzameling sleutel / waarde-paren, waarbij de sleutel is uniek. Deze definitie is cruciaal voor uw begrip van HBase, omdat het HBase-gegevensmodel vaak op verschillende manieren wordt beschreven - vaak onvolledig als een kolomgerichte winkel.

HBase is onderaan een sleutewaardegegevensarchief waarin elke sleutel uniek is - wat betekent dat deze maximaal één keer in de HBase-gegevensopslag verschijnt. Bovendien is de kaart gesorteerd en multidimensionaal. De sleutels worden in HBase opgeslagen en in byte-lexicografische volgorde gesorteerd. Elke waarde kan meerdere versies hebben, waardoor het datamodel multidimensionaal wordt. Standaard worden dataversies geïmplementeerd met een tijdstempel.

De attributen van HBase - dummies

Bewerkers keuze

Tien Helpbronnen voor Junos OS - dummies

Tien Helpbronnen voor Junos OS - dummies

Dit is een top-tien lijst met bronnen die u moet zoeken meer informatie over softwarebewerkingen, training en ondersteuning voor Junos - alle extra details die u mogelijk nodig heeft om Junos OS te kunnen configureren en bedienen in uw eigen netwerkimplementaties. CLI Help-commando's Bent u op zoek naar meer achtergrondinformatie over hoe een bepaalde functie ...

De functie van de drie vlakken van Junos netwerk OS - dummies

De functie van de drie vlakken van Junos netwerk OS - dummies

De architectuur van de Junos opererende systeem verdeelt de functies van besturing, services en doorsturen op verschillende niveaus. Elk van de vlakken van Junos OS biedt een kritieke set van functionaliteit in de werking van het netwerk. Besturingsvlak van het Junos-netwerkbesturingssysteem (NOS) Alle functies van het besturingsvlak lopen op ...

De basisprincipes van BGP-routebealing - dummy's

De basisprincipes van BGP-routebealing - dummy's

Het configureren van Border Gateway Protocol (BGP) kan nogal lastig zijn, vooral met grote aantallen peersessies die handmatig moeten worden geconfigureerd. In feite kan in een groot netwerk de full-mesh-vereiste voor IBGP een provisioning-nachtmerrie zijn. BGP's antwoord op de IBGP-paring-configuratie-nachtmerrie die het volledige maaswerk is, wordt routeberefening genoemd. Route ...

Bewerkers keuze

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Noodzakelijke elementen voor SEO om hoge trefwoorden te krijgen - dummies

Als de allerbeste locatie op het web staat op de pagina een van de zoekmachines, je moet de SEO-elementen kennen die je daar kunnen brengen. Een goede plek om te beginnen is met zoekwoorden. Zoekmachines gebruiken geavanceerde processen om zoekwoordgebruik en andere factoren te categoriseren en analyseren om erachter te komen ...

Persberichten als bron van SEO-inhoud - dummies

Persberichten als bron van SEO-inhoud - dummies

Het leuke aan persberichten is dat u ze zonder toestemming op uw website kunt gebruiken, en sommige zullen al voor de zoekmachine zijn geoptimaliseerd. Het doel van een persbericht is om het uit te sturen en te zien wie het ophaalt. U hoeft geen contact op te nemen met de eigenaar van het persbericht, omdat ...

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Kies een domeinnaam die geoptimaliseerd is voor zoekmachines - dummies

Zelfs de domeinnaam van uw site moet geoptimaliseerd voor zoekmachines. Zoekmachines lezen uniforme resource locators (URL's), op zoek naar sleutelwoorden erin. Bijvoorbeeld als u een website heeft met de domeinnaam knaagdierracen. com en iemand zoekt Google op knaagdierenraces, Google ziet rodent-racing als een wedstrijd; omdat er een streepje verschijnt tussen de twee ...

Bewerkers keuze

Praxis Elementair onderwijs Examen-Economie - dummies

Praxis Elementair onderwijs Examen-Economie - dummies

U zult enkele basisconcepten van de economie voor de Praxis moeten kennen Elementair onderwijs examen. Elementaire economie onderzoekt de wens voor, de productie van en de verkoop en het gebruik van geld, zowel lokaal als wereldwijd. Het onderwijzen van economie omvat concepten zoals behoeften versus behoeften, kosten en meer tot nadenken stemmende onderwerpen, zoals de volgende: ...

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Praxis Elementair onderwijs voor Dummy's Cheat Sheet - dummies

Het Praxis basisonderwijs: Curriculum, instructie en beoordeling examen (5017) bestrijkt een breed scala van wat u moet weten over basisonderwijs. Als u het Praxis Elementary Education: Content Knowledge-examen (5018) neemt, moet u zich ervan bewust zijn dat het de dekking beperkt tot de inhoud van de vier hoofdonderwerpen die een elementaire leraar is ...

Praxis Core For Dummies Cheat Sheet - dummies

Praxis Core For Dummies Cheat Sheet - dummies

Voordat je te opgewonden raakt, begrijp dat de informatie die volgt niet klopt eigenlijk niet over het bedriegen van de Praxis. Het gaat echt meer om de meest efficiënte manieren om je voor te bereiden op het examen. Maar "voorbereidingsblad" heeft niet helemaal dezelfde reden. Trouwens, vals spelen is niet nodig als je weet wat je aan het doen bent, en ...