Huis Persoonlijke financiën Document Databases in een Big Data-omgeving - dummies

Document Databases in een Big Data-omgeving - dummies

Inhoudsopgave:

Video: Inside a Google data center 2024

Video: Inside a Google data center 2024
Anonim

U vindt twee soorten documentdatabases voor big data-projecten. Een daarvan wordt vaak omschreven als een opslagplaats voor inhoud in volledige documentstijl. De andere is een database voor het opslaan van documentcomponenten voor permanente opslag als een statische entiteit of voor dynamische assemblage van de delen van een document. De structuur van de documenten en hun onderdelen wordt geleverd door JavaScript Object Notation (JSON) en / of Binary JSON (BSON).

Documentdatabases zijn het nuttigst wanneer u veel rapporten moet produceren en deze dynamisch moeten worden samengesteld uit elementen die vaak veranderen.

In de kern is JSON een gegevensuitwisselingsindeling, gebaseerd op een subset van de JavaScript-programmeertaal. Hoewel het deel uitmaakt van een programmeertaal, is het van tekstuele aard en zeer gemakkelijk te lezen en te schrijven. Het heeft ook het voordeel dat het gemakkelijk is voor computers om te verwerken. Er zijn twee basisstructuren in JSON en deze worden ondersteund door vele, zo niet alle, moderne programmeertalen.

De eerste basisstructuur is een verzameling naam / waarde-paren en deze worden programmatisch weergegeven als objecten, records, gecodeerde lijsten, enzovoort. De tweede basisstructuur is een geordende zoeklijst en ze worden programmatisch weergegeven als arrays, lijsten of reeksen. BSON is een binaire serialisatie van JSON-structuren die zijn ontworpen om de prestaties en schaalbaarheid te verbeteren.

MongoDB voor big data

MongoDB is de projectnaam voor het "hu (mongo) us-database" -systeem. Het wordt onderhouden door een bedrijf genaamd 10gen als open source en is vrij verkrijgbaar onder de GNU AGPL v3. 0 licentie. Commerciële licenties met volledige ondersteuning zijn verkrijgbaar bij 10gen.

MongoDB is samengesteld uit databases met "verzamelingen. "Een verzameling bestaat uit" documenten "en elk document bestaat uit velden. Net als in relationele databases, kunt u een verzameling indexeren.

Als u dit doet, worden de prestaties van het opzoeken van gegevens verbeterd. In tegenstelling tot andere databases retourneert MongoDB echter iets dat een 'cursor' wordt genoemd en dat dient als verwijzing naar de gegevens. Dit is een zeer nuttige mogelijkheid omdat het de mogelijkheid biedt om de gegevens te tellen of te classificeren zonder deze te extraheren. Oorspronkelijk ondersteunt MongoDB BSON, de binaire implementatie van JSON-documenten.

MongoDB is ook een ecosysteem dat bestaat uit de volgende elementen:

  • Hoge beschikbaarheid en replicatieservices voor schaalvergroting op lokale en wide-area netwerken.

  • Een op rasters gebaseerd bestandssysteem, waarmee grote objecten kunnen worden opgeslagen door ze over meerdere documenten te verdelen.

  • MapReduce om analyse en aggregatie van verschillende collecties / documenten te ondersteunen.

  • Een shardingservice die een enkele database verdeelt over een cluster van servers in een enkele of meerdere datacenters. De service wordt aangestuurd door een shard-sleutel. De shard-sleutel wordt gebruikt om documenten intelligent over meerdere instanties te distribueren.

  • Een queryservice die adhoc-query's, gedistribueerde query's en zoeken in volledige tekst ondersteunt.

Effectieve MongoDB-implementaties omvatten

  • Hoogvolume inhoudsbeheer

  • Sociale netwerken

  • Archivering

  • Realtime analyses

CouchDB voor grote gegevens

Een andere zeer populaire niet-relationele database is CouchDB. Net als MongoDB is CouchDB open source. Het wordt onderhouden door de Apache Software Foundation en wordt beschikbaar gesteld onder de Apache-licentie v2. 0. In tegenstelling tot MongoDB, was CouchDB ontworpen om het web in alle opzichten na te bootsen.

CouchDB is bijvoorbeeld bestand tegen drop-outs van het netwerk en blijft prachtig werken in gebieden waar de netwerkconnectiviteit onregelmatig is. Het is ook thuis op een smartphone of in een datacenter. Dit komt allemaal met een paar compromissen. Vanwege de onderliggende webmimicry heeft CouchDB een hoge latentie resulterend in een voorkeur voor lokale gegevensopslag.

CouchDB is niet goed geschikt voor kleinere implementaties. U moet bepalen of deze afwegingen kunnen worden genegeerd terwijl u aan de implementatie van uw big data begint.

CouchDB-databases zijn samengesteld uit documenten die bestaan ​​uit velden en bijlagen, evenals een "beschrijving" van het document in de vorm van metadata die automatisch door het systeem wordt onderhouden. De onderliggende technologie bevat alle ACID-mogelijkheden. Het voordeel in CouchDB ten opzichte van relationeel is dat de gegevens zijn verpakt en klaar zijn voor manipulatie of opslag in plaats van verspreid over rijen en tabellen.

CouchDB is ook een ecosysteem met de volgende mogelijkheden:

  • Verdichting: De databases worden gecomprimeerd om verspilling van ruimte te voorkomen wanneer een bepaald niveau van leegte wordt bereikt. Dit helpt de prestaties en efficiëntie voor persistentie.

  • Weergavemodel: Een mechanisme voor het filteren, organiseren en rapporteren van gegevens met behulp van een reeks definities die als documenten in de database worden opgeslagen. U vindt een één-op-veel-relatie tussen databases met weergaven, zodat u veel verschillende manieren kunt creëren om de gegevens weer te geven die u hebt "in plakken gesneden en in blokjes gesneden". "

  • Replicatie en gedistribueerde services: Documentopslag is ontworpen om bidirectionele replicatie te bieden. Gedeeltelijke replica's kunnen worden gehandhaafd om op criteria gebaseerde distributie of migratie naar apparaten met beperkte connectiviteit te ondersteunen. Native replicatie is peer-gebaseerd, maar u kunt Master / Slave-, Master / Master- en andere typen replicatiemodaliteiten implementeren.

Effectieve CouchDB-implementaties omvatten

  • Hoogvolume inhoudsbeheer

  • Schalen van smartphone naar datacenter

  • Toepassingen met beperkte of langzame netwerkconnectiviteit

Document Databases in een Big Data-omgeving - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...