Huis Persoonlijke financiën Image Classificatie met Hadoop - dummies

Image Classificatie met Hadoop - dummies

Video: Machine Learning with TensorFlow and PyTorch on Apache Hadoop using Cloud Dataproc (Cloud Next '19) 2024

Video: Machine Learning with TensorFlow and PyTorch on Apache Hadoop using Cloud Dataproc (Cloud Next '19) 2024
Anonim

Beeldclassificatie vereist een aanzienlijke hoeveelheid gegevensverwerkingsresources die echter de schaal van implementaties heeft beperkt. Beeldclassificatie is een hot topic in de Hadoop-wereld omdat geen enkele gangbare technologie in staat was - tot Hadoop kwam - deuren te openen voor dit soort dure verwerking op zo'n enorme en efficiënte schaal.

Afbeeldingsclassificatie begint met het idee dat u een trainingsset bouwt en dat computers leren identificeren en classificeren waarnaar ze kijken. Op dezelfde manier dat het hebben van meer gegevens helpt bij het bouwen van betere fraudedetectie- en risicomodellen, helpt het ook systemen om beelden beter te classificeren.

In dit geval worden de gegevens de trainingsset genoemd, evenals de modellen classificaties. Classifiers herkennen functies of patronen in geluid, afbeelding of video en classificeren deze op de juiste manier. Classifiers worden gebouwd en iteratief verfijnd van trainingssets zodat hun precisiescores (een mate van exactheid) en recall-scores (een mate van dekking) hoog zijn.

Hadoop is goed geschikt voor beeldclassificatie omdat het een massaal parallelle verwerkingsomgeving biedt om niet alleen classificatiemodellen te maken (iteratie van trainingsets), maar ook vrijwel onbeperkte schaalbaarheid biedt om die classificatoren te verwerken en uit te voeren in enorme sets ongestructureerde gegevensvolumes.

Denk aan multimediabronnen zoals YouTube, Facebook, Instagram en Flickr - allemaal bronnen van ongestructureerde binaire gegevens. De afbeelding toont een manier waarop u Hadoop kunt gebruiken om de verwerking van grote hoeveelheden opgeslagen afbeeldingen en video voor multimedia semantische classificatie te schalen.

U kunt zien hoe alle concepten met betrekking tot het Hadoop-verwerkingsraamwerk op deze gegevens worden toegepast. Merk op hoe afbeeldingen in HDFS worden geladen. De classificatiemodellen, gebouwd in de loop van de tijd, worden nu toegepast op de extra afbeeldingsfunctiecomponenten in de kaartfase van deze oplossing. Zoals je kunt zien in de rechterbenedenhoek, bestaat de uitvoer van deze verwerking uit beeldclassificaties die variëren van cartoons tot sport en locaties, onder andere.

Hadoop kan ook worden gebruikt voor audio- of spraakanalyse. Eén klant in de beveiligingsindustrie waarmee we werken, creëert een audiorubricatiesysteem om geluiden te classificeren die worden gehoord via akoestisch verrijkte glasvezelkabels die rond de perimeter van kernreactoren zijn gelegd.

Dit systeem weet bijvoorbeeld bijna onmiddellijk het gefluister van de wind te classificeren in vergelijking met het gefluister van een menselijke stem of om het geluid van menselijke voetstappen die in de omringende parken lopen te onderscheiden van die van dieren in het wild.

Deze beschrijving heeft misschien een Star Trek uitstraling, maar je kunt nu live voorbeelden zien. In feite maakt IBM een van de grootste beeldclassificatiesystemen ter wereld bekend, via het IBM Multimedia Analysis and Retrieval System (IMARS).

Dit is het resultaat van een IMARS-zoekopdracht voor de term alpineskiën. Bovenaan de afbeelding ziet u de resultaten van de classificatiemiddelen die zijn toegewezen aan de afbeeldingsset die door Hadoop is verwerkt, samen met een bijbehorende tagwolk.

Let op de meer grof gedefinieerde ouderclassifier, in tegenstelling tot de meer gedetailleerde. Merk in feite de meervoudige classificatieniveaus op: rollen naar, die rollen - allemaal automatisch gegenereerd door het classificatiemodel, gebouwd en gescoord met Hadoop.

Geen van deze afbeeldingen heeft toegevoegde metadata. Niemand heeft iPhoto geopend en een afbeelding getagd als een wintersport om het in deze classificatie te laten verschijnen. Het is de classificator voor de wintersport die is gebouwd om beeldkenmerken en kenmerken van sporten te herkennen die in een winteromgeving worden gespeeld.

Afbeeldingsclassificatie heeft veel toepassingen, en als u deze classificatie op grote schaal met Hadoop kunt uitvoeren, krijgt u meer analysemogelijkheden omdat andere toepassingen de classificatie-informatie kunnen gebruiken die voor de afbeeldingen is gegenereerd.

Bekijk dit voorbeeld van de gezondheidsindustrie. Een groot zorgkantoor in Azië was gericht op het leveren van gezondheidszorg via mobiele klinieken aan een plattelandsbevolking verdeeld over een grote landmassa. Een belangrijk probleem waarmee het bureau werd geconfronteerd, was de logistieke uitdaging van het analyseren van de medische beeldvormingsgegevens die werden gegenereerd in zijn mobiele klinieken.

Een radioloog is in dit deel van de wereld een schaars goed, dus het was logisch om de medische beelden elektronisch naar een centraal punt te verzenden en door een leger van artsen te laten onderzoeken. De artsen die de beelden bekeken, werden echter snel overbelast.

Het bureau werkt nu aan een classificatiesysteem om te helpen bij het identificeren van mogelijke voorwaarden om op een effectieve manier suggesties aan de artsen te verstrekken om te verifiëren. Vroege testen hebben deze strategie aangetoond om het aantal gemiste of onnauwkeurige diagnoses te helpen verminderen, waardoor tijd, geld en vooral levens worden bespaard.

Image Classificatie met Hadoop - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...