Risicomodellen met Hadoop - dummies - Persoonlijke financiën 2024

Risicomodellering is een ander belangrijk gebruik dat door Hadoop wordt gestimuleerd. U zult merken dat het nauw aansluit bij het gebruik van fraudedetectie omdat het een op modellen gebaseerde discipline is. Hoe meer gegevens u hebt en hoe meer u "de punten kunt verbinden", hoe vaker uw resultaten betere risicovoorspellingsmodellen opleveren.

Het allesomvattende woord risico kan veel betekenissen aannemen. Klantverloopvoorspelling is bijvoorbeeld het risico dat een klant naar een concurrent verhuist; het risico van een kredietportefeuille heeft betrekking op het risico van wanbetaling; Het risico in de gezondheidszorg loopt uiteen van beheersing van de uitbraak tot voedselveiligheid tot de kans op herinfectie en meer.

De financiële sector (FSS) investeert nu zwaar in op Hadoop gebaseerde risicomodellering. Deze sector wil de automatisering en nauwkeurigheid van zijn risicobeoordeling en blootstellingsmodellering verhogen.

Hadoop biedt deelnemers de mogelijkheid om de datasets die in hun risicomodel worden gebruikt uit te breiden met onderbenutte bronnen (of bronnen die nooit worden gebruikt), zoals e-mail, instant messaging, sociale media en interacties met klantenservice vertegenwoordigers, onder andere gegevensbronnen.

Risicomodellen in FSS duiken overal op. Ze worden gebruikt voor klantverlooppreventie, modellering van handelsmanipulatie, bedrijfsrisico's en blootstellingsanalyses, en meer.

Wanneer een bedrijf thuis een verzekering tegen natuurrampen afgeeft, is een uitdaging duidelijk te zien hoeveel geld mogelijk gevaar loopt. Als de verzekeraar nalaat om geld te reserveren voor mogelijke uitbetalingen, zullen regelgevers ingrijpen (de verzekeraar wil dat niet); als de verzekeraar te veel geld in zijn reserves steekt om toekomstige polisvorderingen uit te betalen, dan kunnen ze uw premiegeld niet beleggen en winst maken (de verzekeraar wil dat ook niet).

Sommige bedrijven zijn "blind" voor het risico dat zij lopen, omdat ze niet in staat zijn geweest om voldoende catastrofale simulaties uit te voeren met betrekking tot variaties in windsnelheid of neerslagsnelheden (naast andere variabelen) wanneer ze verband houden tot hun blootstelling.

Heel eenvoudig: deze bedrijven hebben moeite met het stresstesten van hun risicomodellen. De mogelijkheid om meer gegevens in te klappen - bijvoorbeeld weerspatronen of de steeds veranderende sociaaleconomische verdeling van hun klantenbestand - geeft hen veel meer inzicht en mogelijkheden als het gaat om het bouwen van betere risicomodellen.

Risicomodellen voor het bouwen en stresstesten, zoals de zojuist beschreven, is een ideale taak voor Hadoop. Deze bewerkingen zijn vaak rekenkundig duur en, als u een risicomodel aan het bouwen bent, waarschijnlijk onpraktisch om tegen een datawarehouse te draaien, om deze redenen:

Het magazijn is waarschijnlijk niet geoptimaliseerd voor de soorten vragen die door het risicomodel worden uitgegeven.(Hadoop is niet gebonden aan de datamodellen die worden gebruikt in datawarehouses.)
Een grote, ad hoc batchtaak, zoals een evoluerend risicomodel, zou het magazijn belasten en bestaande analytische applicaties beïnvloeden. (Hadoop kan deze werklast op zich nemen en het magazijn vrijmaken voor regelmatige bedrijfsrapportage.)
Meer geavanceerde risicomodellen moeten mogelijk rekening houden met ongestructureerde gegevens, zoals onbewerkte tekst. (Hadoop kan die taak efficiënt aan.)