Huis Persoonlijke financiën RDBMS's in een Big Data-omgeving - dummies

RDBMS's in een Big Data-omgeving - dummies

Inhoudsopgave:

Video: Sqoop Import and Export data from RDMBS and HDFS 2024

Video: Sqoop Import and Export data from RDMBS and HDFS 2024
Anonim

kunnen combineren. Big data worden een belangrijk element in de manier waarop organisaties high-volume data op de juiste snelheid gebruiken om specifieke data op te lossen problemen. Relationele databasebeheersystemen zijn belangrijk voor dit hoge volume. Big data leven niet geïsoleerd. Om effectief te zijn, moeten bedrijven vaak de resultaten van big data-analyse kunnen combineren met de gegevens die binnen het bedrijf bestaan.

Basis voor big data: RDBMS en persistente gegevens

Een van de belangrijkste services van operationele databases (ook wel dataopslag genoemd) is persistentie. Persistence garandeert dat de gegevens die zijn opgeslagen in een database niet zonder toestemming worden gewijzigd en dat deze beschikbaar zijn zolang deze van belang zijn voor het bedrijf. Wat heb je eraan als een database niet kan worden vertrouwd om de gegevens te beschermen die je erin stopt?

Gezien deze belangrijkste vereiste, moet u vervolgens nadenken over wat voor soort gegevens u wilt behouden, hoe u deze kunt openen en bijwerken en hoe u deze kunt gebruiken om zakelijke beslissingen te nemen. Op dit meest fundamentele niveau is de keuze van uw databasemotoren cruciaal voor uw algehele succes bij de implementatie van big data.

Hoewel de onderliggende technologie al geruime tijd bestaat, zijn veel van deze systemen momenteel in bedrijf omdat de bedrijven die zij ondersteunen in hoge mate afhankelijk zijn van de gegevens. Het vervangen ervan zou verwant zijn aan het veranderen van de motoren van een vliegtuig tijdens een transoceanische vlucht.

Basis voor big data: RDBMS en tabellen

Relationele databases zijn gebaseerd op een of meer relaties en worden weergegeven door tabellen. Deze tabellen worden gedefinieerd door hun kolommen en de gegevens worden opgeslagen in de rijen. De primaire sleutel is vaak de eerste kolom in de tabel. De consistentie van de database en veel van zijn waarde worden bereikt door de gegevens te "normaliseren". Genormaliseerde gegevens zijn geconverteerd van oorspronkelijke indeling naar een gedeeld, overeengekomen formaat.

In één database heeft u bijvoorbeeld 'telefoon' als XXX-XXX-XXXX, terwijl in een andere deze XXXXXXXXX is. Voor een consistent beeld van de informatie moet het veld worden genormaliseerd naar een andere vorm. Er zijn vijf niveaus van normen voor normalisatie. De keuze van de normale vorm wordt vaak naar de databaseontwerper verwezen. De verzameling tabellen, sleutels, elementen enzovoort wordt het schema van de database genoemd.

In de loop der jaren is de gestructureerde querytaal (SQL) geëvolueerd in de vergrendelingsstap met RDBMS-technologie en is het meest gebruikte mechanisme voor het maken, opvragen, onderhouden en beheren van relationele databases.

In bedrijven, zowel kleine als grote, wordt de meeste van hun belangrijke bedrijfsinformatie waarschijnlijk opgeslagen in RDBMS's. Veel bedrijven hebben verschillende RDBMS's voor verschillende delen van hun bedrijf. Transactiegegevens kunnen worden opgeslagen in de database van één leverancier, terwijl klantinformatie kan worden opgeslagen in een andere.

Het is niet waarschijnlijk dat u RDBMS's zult gebruiken voor de kern van de implementatie, maar u zult moeten vertrouwen op de gegevens die zijn opgeslagen in RDBMS's om het hoogste niveau van waarde voor het bedrijf met big data te creëren.

PostgreSQL, een open source relationele database

Tijdens uw implementatie van big data zult u waarschijnlijk PostgreSQL tegenkomen, een veel gebruikte, open source relationele database. Verschillende factoren dragen bij aan de populariteit van PostgreSQL. Als een RDBMS met ondersteuning voor de SQL-standaard, doet het alle dingen die in een databaseproduct worden verwacht, plus de lange levensduur en het brede gebruik ervan hebben het tot een strijd getest. "Het is ook beschikbaar op vrijwel alle besturingssystemen, van pc's tot mainframes.

De basis bieden en dit betrouwbaar doen, is slechts een deel van het verhaal. PostgreSQL ondersteunt ook veel functies die alleen worden aangetroffen in dure eigen RDBMS's, waaronder:

  • Mogelijkheid om "objecten" direct te verwerken in het relationele schema

  • Vreemde sleutels (verwijzend naar sleutels van de ene tabel in een andere)

  • Triggers (gebeurtenissen gebruikt om automatisch een opgeslagen procedure te starten)

  • Complexe query's (subquery's en joins over discrete tabellen)

  • Transactionele integriteit

  • Multiversion concurrency control

De echte kracht van PostgreSQL is de uitbreidbaarheid. Gebruikers en databaseprogrammeurs kunnen nieuwe mogelijkheden toevoegen zonder de fundamentele werking of betrouwbaarheid van de database te beïnvloeden. Mogelijke uitbreidingen zijn

  • Datatypes

  • Operators

  • Functies

  • Indexeringsmethoden

  • Proceduretalen

Dit hoge aanpassingsniveau maakt PostgreSQL wenselijk wanneer rigide, door eigendomsrechten beschermde producten de klus niet klaren. Het is oneindig uitbreidbaar.

Ten slotte maakt de PostgreSQL-licentie modificatie en distributie in elke vorm, open of gesloten bron mogelijk. Elke wijziging kan privé worden gehouden of met de gemeenschap worden gedeeld zoals u dat wilt.

RDBMS's in een Big Data-omgeving - dummies

Bewerkers keuze

Gratis Software: autofilling-cellen in OpenOffice. org Calc - dummies

Gratis Software: autofilling-cellen in OpenOffice. org Calc - dummies

OpenOffice. org - een gratis alternatief voor Microsoft Office - bevat Calc, een spreadsheetprogramma vergelijkbaar met Excel. Calc biedt een eenvoudige manier om automatisch een kolom of rij met getallen te maken in elke volgorde die u opgeeft. Deze functie voor automatisch aanvullen is handig voor het maken van genummerde lijsten of het invullen van kolom- en rijkoppen van tabellen, zoals ...

Handige Shortcuts in Prezi's Show Mode - dummies

Handige Shortcuts in Prezi's Show Mode - dummies

Prezi heeft twee verschillende werkingsmodi: Edit Mode, waarin u maak je presentatie en Show Mode, waarin je je creaties presenteert. Gebruik deze handige sneltoetsen in de weergavemodus om uw presentatie nog vlotter te laten verlopen. Gebruik dit als een oefenchecklist voordat je begint: Gebruik deze functie: Om dit te doen: Volledige ...

Te gebruiken hoe het Prezi padhulpmiddel te gebruiken - dummies

Te gebruiken hoe het Prezi padhulpmiddel te gebruiken - dummies

Prezi heeft een padhulpmiddel dat u gebruikt om in te stellen en volg je verhaallijn. In het bijzonder helpt de tool u bij het instellen van padnummers die uw presentatie van element naar element verplaatsen, ongeacht de nabijheid. Op die manier verlies je nooit je plaats. Bovendien kun je met een ingesteld pad je Prezi verzenden als ...

Bewerkers keuze

Tracking van klantbetalingen in QuickBooks 2003 - dummies

Tracking van klantbetalingen in QuickBooks 2003 - dummies

Als uw klanten u niet altijd betalen -front voor hun aankopen, moet u een ander type betaling opnemen - die door klanten worden betaald om te betalen of om te betalen wat u hen hebt gefactureerd. Om de betalingen te registreren, moet u natuurlijk eerst facturen voor de klant registreren. Als u kredietmemo's uitgeeft ...

Liquiditeitsratio's en QuickBooks 2012 - dummies

Liquiditeitsratio's en QuickBooks 2012 - dummies

Liquiditeitsverhoudingen, een van de verschillende soorten verhoudingen die u kunt gebruiken in QuickBooks 2012, meten hoe gemakkelijk en comfortabel een bedrijf zijn directe financiële verplichtingen kan nakomen en onmiddellijke financiële kortetermijnmogelijkheden kan benutten. Als al het andere bijvoorbeeld gelijk is, kan het bedrijf dat op een groot aantal contanten zit gemakkelijker zijn rekeningen betalen ...

Voorraad beheren in een productiebedrijf met QuickBooks 2011 - dummies

Voorraad beheren in een productiebedrijf met QuickBooks 2011 - dummies

Zelfs met QuickBooks, inventaris bijhouden in een productiebedrijf kan moeilijker zijn dan in andere soorten bedrijven. Het probleem komt voort uit enkele lastige boekhoudkundige vereisten. QuickBooks lost het eerste probleem op met betrekking tot productievoorraad; QuickBooks lost het tweede probleem echter niet op. In een productieomgeving combineert de fabrikant onbewerkte ...

Bewerkers keuze

Animeren langs een pad met Flash CS5 Motion Guides en Snapping - dummies

Animeren langs een pad met Flash CS5 Motion Guides en Snapping - dummies

Bewegings-tweens die u maakt in Adobe Flash Creative Suite 5 omvat eenvoudige animaties van de ene locatie naar de andere. Voor sommige Flash CS5-tweens wil je echter dat je symbool een uitgebreider bewegingspad volgt, zoals een raceauto die een nummer volgt. In dergelijke gevallen kunt u uw tween een specifieke ...

Maak een Flash CS5-document - dummies

Maak een Flash CS5-document - dummies

Om aan de slag te gaan met Adobe Flash Creative Suite 5, u wilt een nieuwe maken Flash-document. Gebruik Flash CS5-documenten om afbeeldingen te maken en te typen en in gang te zetten met op tijdlijnen gebaseerde animaties, filmfragmenten en interactieve knoppen. Voeg foto's, geluid en video toe aan uw Flash-document voor een nog rijkere ervaring. Gebruik Flash ...

Een filmclipsymbool maken in Flash CS5 - dummies

Een filmclipsymbool maken in Flash CS5 - dummies

Niet-geanimeerde Adobe Flash Creative Suite 5-afbeeldingen geconverteerd naar Flash CS5-filmclips gedragen zich hetzelfde als grafische symbolen, zodat u instanties op het werk kunt plaatsen, tweenen en wijzigen. Het verschil is echter dat je altijd geanimeerde inhoud later aan de filmclip kunt toevoegen door deze zelf te bewerken en zelf tweens te maken ...