Video: Basis elektrische veiligheid 2024
Gegevens in voorspellende analyses kunnen worden geïdentificeerd als gestreamd, statisch of een combinatie van beide. Gestreamde gegevens worden continu gewijzigd; voorbeelden zijn de constante stroom Facebook-updates, tweets op Twitter en de voortdurend veranderende aandelenkoersen terwijl de markt nog steeds open is.
Gestreamde gegevens veranderen continu; statische gegevens is op zichzelf staand en ingesloten. De problemen in verband met statische gegevens zijn onder meer hiaten, uitschieters of onjuiste gegevens, die mogelijk enige opschoning, voorbereiding en voorverwerking vereisen voordat u statische gegevens voor een analyse kunt gebruiken.
Net als bij gestreamde gegevens kunnen er andere problemen optreden. Volume kan een probleem zijn; de enorme hoeveelheid non-stop data die constant aankomt kan overweldigend zijn. En hoe sneller de gegevens binnenstromen, des te moeilijker het is om de analyse bij te houden.
De twee belangrijkste modellen voor het analyseren van gestreamde gegevens zijn de volgende:
-
Onderzoek alleen de nieuwste gegevenspunten en neem een beslissing over de status van het model en de volgende zet. Deze benadering is incrementeel - in feite een beeld opbouwend van de gegevens zodra deze binnenkomen.
-
Evalueer de hele dataset, of een subset ervan, om een beslissing te nemen telkens wanneer nieuwe datapunten aankomen. Deze benadering omvat meer gegevenspunten in de analyse - wat de "volledige" gegevensset verandert telkens wanneer nieuwe gegevens worden toegevoegd.
Afhankelijk van de aard van uw bedrijf en de verwachte impact van de beslissing, heeft het ene model de voorkeur boven het andere.
Sommige bedrijfsdomeinen, zoals de analyse van milieu-, markt- of intelligentiegegevens, prijzen nieuwe gegevens die in realtime aankomen. Al deze gegevens moeten worden geanalyseerd terwijl deze worden gestreamd - en niet alleen correct, maar meteen worden geïnterpreteerd.
Op basis van de nieuw beschikbare informatie hertekent het model de gehele interne weergave van de buitenwereld. Door dit te doen, beschikt u over de meest actuele basis voor een beslissing die u mogelijk snel moet nemen en uitvoeren.
Een voorspellingsanalysemodel kan bijvoorbeeld een aandelenkoers verwerken als een gegevensfeed, zelfs terwijl de gegevens snel veranderen, de gegevens analyseren in de context van onmiddellijke marktomstandigheden die in realtime bestaan en vervolgens beslissen of een bepaalde voorraad.
Het analyseren van gestreamde gegevens verschilt duidelijk van het analyseren van statische gegevens. Het analyseren van een combinatie van beide gegevenstypen kan nog uitdagender zijn.