Huis Persoonlijke financiën Verschillende benaderingen van Big Data Analysis - dummies

Verschillende benaderingen van Big Data Analysis - dummies

Inhoudsopgave:

Video: Sampling: Simple Random, Convenience, systematic, cluster, stratified - Statistics Help 2024

Video: Sampling: Simple Random, Convenience, systematic, cluster, stratified - Statistics Help 2024
Anonim

In veel gevallen zal big data-analyse worden gepresenteerd aan de eindgebruiker via rapporten en visualisaties. Omdat de onbewerkte gegevens onbegrijpelijk gevarieerd kunnen zijn, moet u vertrouwen op analysetools en -technieken om de gegevens op een zinvolle manier te presenteren.

Nieuwe applicaties komen beschikbaar en zullen grofweg in twee categorieën vallen: op maat of semi-aangepast.

Aangepaste toepassingen voor big data-analyse

Over het algemeen wordt een aangepaste toepassing gemaakt voor een specifiek doel of een gerelateerde reeks doelen. Voor big data-analyse is het doel van ontwikkeling van aangepaste applicaties het versnellen van de tijd voor besluitvorming of actie.

R-omgeving

De "R" -omgeving is gebaseerd op de "S" -statistieken en analysetaal die in de jaren 90 door Bell Laboratories zijn ontwikkeld. Het wordt onderhouden door het GNU-project en is beschikbaar onder de GNU-licentie.

Hoewel het een uitdaging is om volledig te begrijpen, maken de diepte en flexibiliteit het een aantrekkelijke keuze voor ontwikkelaars van analytische apps en "krachtige gebruikers". "Bovendien onderhoudt het CRAN R-project een wereldwijde set File Transfer Protocol en webservers met de meest recente versies van de R-omgeving. Een commercieel ondersteunde, zakelijke versie van R is ook verkrijgbaar bij Revolution Analytics.

Meer specifiek is R een geïntegreerd pakket softwaretools en -technologieën die zijn ontworpen om aangepaste applicaties te maken die worden gebruikt om gegevensmanipulatie, berekening, analyse en visuele weergave te vergemakkelijken. Naast andere geavanceerde functies, ondersteunt het

  • Effectieve componenten voor gegevensverwerking en manipulatie.

  • Operators voor berekeningen op matrices en andere soorten geordende gegevens.

  • Hulpmiddelen die specifiek zijn voor een breed scala aan gegevensanalyses.

  • Geavanceerde visualisatiemogelijkheden.

  • S programmeertaal ontworpen door programmeurs, voor programmeurs met veel bekende constructies, waaronder conditionals, loops, door de gebruiker gedefinieerde recursieve functies en een breed scala aan invoer- en uitvoerfaciliteiten.

R is goed geschikt voor individuele, aangepaste toepassingen voor analyse van big data-bronnen.

Google Prediction API

De Google Prediction API is een voorbeeld van een opkomende klasse toepassingen voor big data-analyse. Het is beschikbaar op de website van Google-ontwikkelaars en is goed gedocumenteerd en voorzien van verschillende mechanismen voor toegang via verschillende programmeertalen. Om u te helpen aan de slag te gaan, is het zes maanden vrij beschikbaar.

De voorspellings-API is vrij eenvoudig. Het zoekt naar patronen en vergelijkt deze met proscriptieve, prescriptieve of andere bestaande patronen.Terwijl het zijn patroonaanpassing uitvoert, leert het ook. "Hoe meer je het gebruikt, hoe slimmer het wordt.

Voorspelling wordt geïmplementeerd als een RESTful API met taalondersteuning voor. NET, Java, PHP, JavaScript, Python, Ruby en vele anderen. Google biedt ook scripts voor toegang tot de API en een clientbibliotheek voor R.

Predictieve analyse is een van de krachtigste potentiële mogelijkheden van big data en de Google Prediction API is een zeer nuttige tool voor het maken van aangepaste applicaties.

Semi-aangepaste toepassingen voor big data-analyse

In werkelijkheid wordt wat veel mensen ervaren als aangepaste toepassingen, feitelijk gemaakt met behulp van "verpakte" componenten of componenten van derden, zoals bibliotheken. Het is niet altijd nodig om een ​​nieuwe applicatie volledig te coderen. Voor het gebruik van verpakte applicaties of componenten moeten ontwikkelaars of analisten code schrijven om deze componenten samen te voegen tot een werkende, aangepaste applicatie. Om de volgende redenen is dit een goede benadering:

  • Snelheid tot implementatie: Omdat u niet elk onderdeel van de toepassing hoeft te schrijven, kan de ontwikkelingstijd aanzienlijk worden verkort.

  • Stabiliteit: Het gebruik van goed geconstrueerde, betrouwbare componenten van derden kan helpen om de aangepaste toepassing veerkrachtiger te maken.

  • Betere kwaliteit: Verpakte componenten zijn vaak onderworpen aan hogere kwaliteitsnormen omdat ze worden geïmplementeerd in een grote verscheidenheid aan omgevingen en domeinen.

  • Meer flexibiliteit: Als een beter component wordt geleverd, kan het worden omgezet in de toepassing, waardoor de levensduur, aanpasbaarheid en bruikbaarheid van de aangepaste toepassing wordt verlengd.

Een ander type semi-aangepaste toepassing is een toepassing waarbij de broncode beschikbaar is en voor een bepaald doel is aangepast. Dit kan een efficiënte aanpak zijn, omdat er nogal wat voorbeelden van applicatiebouwstenen beschikbaar zijn om op te nemen in uw semi-aangepaste toepassing:

  • TA-Lib: De bibliotheek met technische analyse wordt veel gebruikt door softwareontwikkelaars die behoefte hebben aan technische analyse van financiële marktgegevens uitvoeren. Het is beschikbaar als open source onder de BSD-licentie, waardoor het kan worden geïntegreerd in semi-aangepaste toepassingen.

  • JUNG: Het Java Universal Network Graph-framework is een bibliotheek die een gemeenschappelijk raamwerk biedt voor analyse en visualisatie van gegevens die kunnen worden weergegeven door een grafiek of netwerk. Het is handig voor analyse van sociale netwerken, belangrijkheidsmaatregelen en datamining. Het is beschikbaar als open source onder de BSD-licentie.

  • GeoTools: Een open source geospatiale toolkit voor het manipuleren van GIS-gegevens in vele vormen, het analyseren van ruimtelijke en niet-ruimtelijke attributen of GIS-gegevens, en het creëren van grafieken en netwerken van de gegevens. Het is beschikbaar onder de GPL2-licentie, waardoor integratie in semi-aangepaste toepassingen mogelijk is.

Verschillende benaderingen van Big Data Analysis - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...