Huis Persoonlijke financiën Distributed Computing Basics for Big Data - dummies

Distributed Computing Basics for Big Data - dummies

Inhoudsopgave:

Video: Internet of Things (IoT) Architecture | IoT Tutorial for Beginners | IoT Training | Edureka 2024

Video: Internet of Things (IoT) Architecture | IoT Tutorial for Beginners | IoT Training | Edureka 2024
Anonim

in te schakelen. Als uw bedrijf een big data-project overweegt, is het belangrijk dat u een aantal basisprincipes van gedistribueerde computers begrijpt eerste. Er is geen enkel gedistribueerd computermodel omdat computerbronnen op verschillende manieren kunnen worden gedistribueerd.

U kunt bijvoorbeeld een reeks programma's op dezelfde fysieke server distribueren en berichtenservice gebruiken om hen in staat te stellen te communiceren en informatie door te geven. Het is ook mogelijk om veel verschillende systemen of servers te hebben, elk met een eigen geheugen, die kunnen samenwerken om één probleem op te lossen.

Waarom distributed computing nodig is voor big data

Niet voor alle problemen is gedistribueerd computergebruik vereist. Als er geen grote tijdsbeperking bestaat, kan complexe verwerking via een gespecialiseerde service op afstand plaatsvinden. Wanneer bedrijven complexe gegevensanalyses moesten uitvoeren, zou IT gegevens verplaatsen naar een externe service of entiteit waar veel reservehulpbronnen beschikbaar waren voor verwerking.

Het was niet dat bedrijven wilden wachten om de resultaten te krijgen die ze nodig hadden; het was gewoon niet economisch haalbaar om voldoende computerresources te kopen om aan deze nieuwe eisen tegemoet te komen. In veel situaties zouden organisaties alleen selecties van gegevens vastleggen in plaats van te proberen alle gegevens vast te leggen vanwege kosten. Analisten wilden alle gegevens, maar moesten genoegen nemen met momentopnamen in de hoop op het juiste moment de juiste gegevens te verzamelen.

Belangrijke doorbraken in hardware en software hebben een revolutie teweeggebracht in de datamanagementsector. Ten eerste hebben innovatie en vraag het vermogen verhoogd en de prijs van hardware verlaagd. Er ontstond nieuwe software die goed wist te profiteren van deze hardware door processen zoals load-balancing en -optimalisatie te automatiseren over een groot aantal knooppunten.

De software bevat ingebouwde regels die begrepen dat bepaalde workloads een bepaald prestatieniveau vereisten. De software behandelde alle knooppunten alsof ze simpelweg één grote verzameling waren voor computer-, opslag- en netwerkactiva, en verplaatste processen zonder onderbreking naar een ander knooppunt als een knooppunt faalde, met behulp van de technologie van virtualisatie.

De veranderende economie van computers en big data

Fast-forward en veel is veranderd. In de afgelopen jaren zijn de kosten voor de aanschaf van computer- en opslagbronnen drastisch afgenomen. Geholpen door virtualisatie veranderden commodity-servers die geclusterd konden worden en blades die in een rack konden worden genetwerkt, de economische aspecten van computing. Deze verandering viel samen met innovatie in software-automatiseringsoplossingen die de beheersbaarheid van deze systemen drastisch hebben verbeterd.

De mogelijkheid om gebruik te maken van distributed computing en parallelle verwerkingstechnieken heeft het landschap dramatisch getransformeerd en de latentie drastisch verminderd. Er zijn speciale gevallen, zoals High Frequency Trading (HFT), waarbij lage latentie alleen kan worden bereikt door servers fysiek op één locatie te lokaliseren.

Het probleem met latency voor big data

Een van de eeuwige problemen met het beheren van gegevens - met name grote hoeveelheden gegevens - is de impact van latentie. Latentie is de vertraging binnen een systeem op basis van vertragingen bij de uitvoering van een taak. Latency is een probleem in elk aspect van computergebruik, inclusief communicatie, gegevensbeheer, systeemprestaties en meer.

Als u ooit een draadloze telefoon hebt gebruikt, hebt u uit de eerste hand latentie ervaren. Het is de vertraging in de overdracht tussen u en uw beller. Soms heeft latentie weinig invloed op de klanttevredenheid, bijvoorbeeld als bedrijven achter de schermen resultaten moeten analyseren om een ​​nieuwe productrelease te plannen. Dit vereist waarschijnlijk geen onmiddellijke reactie of toegang.

Hoe dichter een klant reageert op het moment van een beslissing, hoe meer latentie van belang is.

Gedistribueerde computer- en parallelle verwerkingstechnieken kunnen een aanzienlijk verschil maken in de latency die klanten, leveranciers en partners ervaren. Veel big data-applicaties zijn afhankelijk van lage latentie vanwege de grote gegevensvereisten voor snelheid en het volume en de verscheidenheid van de gegevens. Het is misschien niet mogelijk om een ​​big data-toepassing te bouwen in een omgeving met hoge latentie als hoge prestaties vereist zijn. De noodzaak om de gegevens bijna realtime te verifiëren, kan ook worden beïnvloed door latentie. Wanneer u te maken hebt met real-time gegevens, betekent een hoge latentie het verschil tussen succes en mislukking.

Grote vraag naar gegevens voldoet aan oplossingen

De groei van het internet als platform voor alles, van handel tot medicijnen, veranderde de vraag naar een nieuwe generatie gegevensbeheer. In de late jaren 1990, motor-en internetbedrijven zoals Google, Yahoo! en Amazon. com waren in staat om hun bedrijfsmodellen uit te breiden door gebruik te maken van goedkope hardware voor computergebruik en opslag.

Vervolgens hadden deze bedrijven een nieuwe generatie softwaretechnologieën nodig waarmee ze inkomsten konden genereren uit de enorme hoeveelheden gegevens die ze van klanten verzamelden. Deze bedrijven konden niet wachten op resultaten van analytische verwerking. Ze hadden de mogelijkheid nodig om deze gegevens in bijna realtime te verwerken en te analyseren.

Distributed Computing Basics for Big Data - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...