Huis Persoonlijke financiën Data Mining - dummies

Data Mining - dummies

Inhoudsopgave:

Video: Data Mining: How You're Revealing More Than You Think 2025

Video: Data Mining: How You're Revealing More Than You Think 2025
Anonim

Het onderscheidende kenmerk van datamining, in vergelijking met bevraging, rapportage of zelfs OLAP, is dat u informatie kunt krijgen zonder dat u specifieke vragen hoeft te stellen.

Datamining heeft twee hoofdrollen in uw Business Intelligence-missie:

  • De rol "Vertel mij wat er kan gebeuren": De eerste rol van datamining is voorspellend, waarin u in feite zegt: "Vertel me wat zou kunnen gebeuren. "Door verborgen kennis in uw datawarehouse op te slaan, worden waarschijnlijkheden en de waarschijnlijkheid van toekomstige trends en voorvallen uitgefloten en aan u gepresenteerd.

  • De rol "Vertel mij iets interessants": Naast mogelijke toekomstige gebeurtenissen en gebeurtenissen, probeert data mining ook interessante informatie op te halen waarvan je waarschijnlijk zou moeten weten, zoals een bijzonder ongebruikelijke relatie tussen de verkoop van twee verschillende producten en hoe die relatie varieert afhankelijk van de plaatsing in uw winkels.

    Hoewel veel van deze interessante weetjes waarschijnlijk bestaan, welke vragen zou u stellen als u een query of OLAP-tool zou gebruiken en hoe zou u de resultaten interpreteren? Datamining helpt je bij deze moeilijke taak om uit te zoeken welke vragen je moet stellen door veel van het gruntwerk voor je te doen.

Datamining in specifieke zakelijke missies

Datamining is met name geschikt voor deze specifieke soorten zakelijke missies:

  • Detecting fraud

  • Bepaling marketingprogramma-effectiviteit

  • Selecteren van wie, van een groot klantenbestand of de algemene bevolking, moet u zich richten als onderdeel van een marketingprogramma

  • De levenscyclus van klanten beheren, inclusief de missie voor klantenbehoud

  • Geavanceerde modellering van bedrijfsprocessen en what-if-scenario's uitvoeren

Denk na over wat zich achter elk van de zakelijke missies in de voorgaande lijst bevindt:

  • Een grote hoeveelheid gegevens

  • Een nog groter aantal aantal combinaties van verschillende stukjes gegevens

  • Intensieve analyse van resultaten, meestal met complexe algoritmen en geavanceerde statistische technieken

Denk nu na over wat u zou moeten doen als u een rapportage- of OLAP-tool zou gebruiken om deze missies te volbrengen. Je zou het vrijwel onmogelijk vinden om een ​​van de voorgaande missies grondig uit te voeren als je een vraag moest stellen en een resultaat moest krijgen, een andere vraag moest stellen en een ander resultaat moest krijgen, en dan die stappen blijven herhalen.

Datamining en kunstmatige intelligentie

Als u al minstens een decennium werkzaam bent in de informatietechnologie (IT), klinken sommige van de voorgaande termen misschien vaag bekend.Ontgrendelde verborgen kennis? Voorspellende functionaliteit? Wacht even - dat is kunstmatige intelligentie!

Vanaf de vroegste dagen van commerciële computeractiviteiten was er een enorme interesse in het ontwikkelen van "denkapparaten" die grote hoeveelheden gegevens kunnen verwerken en beslissingen kunnen nemen op basis van die analyse.

De belangstelling voor kunstmatige intelligentie (AI) bereikte halverwege de jaren tachtig zijn hoogtepunt. Op dat moment werkten databaseleveranciers aan het produceren van knowledge base management-systemen (KBMS's); andere leveranciers kwamen uit met expertsysteem shells, of op KI gebaseerde frameworks voor applicatieontwikkeling die technieken zoals forward-chaining en back-chain-chaining gebruikten om gebruikers te adviseren over beslissingen; en neurale netwerken werden gepositioneerd als de volgende grote AI-ontwikkeling.

De belangstelling voor AI nam af in het begin van de jaren negentig, toen de verwachtingen groter waren dan de beschikbare mogelijkheden en andere waanzin, zoals migratie van client / server en (natuurlijk) datawarehousing, centraal stond.

Nu is AI terug!

De AI-techniek met het grootste profiel die wordt gebruikt in datamining, is neurale netwerken. Neurale netwerken werden oorspronkelijk beschouwd als een verwerkingsmodel dat de manier zou nabootsen waarop het menselijk brein problemen oplost, met behulp van neuronen en zeer parallelle verwerking om patroonoplossingen te doen.

Het toepassen van neuraal netwerkalgoritmen op de gebieden van business intelligence die door data mining worden afgehandeld (opnieuw, voorspellend en "vertel me iets interessants" missies) lijkt een natuurlijke match te zijn.

Hoewel het data mining / neurale netwerkspel zeker de moeite waard is om te controleren, moet je het voorzichtig doen. Je kunt veel interessante en opwindende technologieën vinden die, in de handen van degenen die de algoritmen niet begrijpen, waarschijnlijk zullen mislukken.

Met de juiste kennis en opleiding kunt u zich er echter volledig voor inzetten om dit type verwerking in uw business intelligence-kader op te nemen als de technische analyse voor de OLAP-gerichte bedrijfsanalyse.

Datamining en statistieken

Het meer ontwikkelde gebied van datamining is de toepassing van geavanceerde statistische technieken tegen de grote hoeveelheden gegevens in uw datawarehouse. Verschillende tools gebruiken verschillende soorten statistische technieken, toegesneden op de specifieke gebieden die ze proberen aan te pakken.

Zonder een statistische achtergrond zou je veel van datamining verwarrend kunnen vinden. U moet veel werk verzetten om de algoritmen te trainen en regels te maken om te zorgen voor de juiste resultaten met grotere datasets. Stel dat u zich op uw gemak voelt met dit concept, of een collega hebt die u hierbij kan helpen, zijn hier enkele van de algemenere algoritmen:

  • Classificatiealgoritmen: Voorspellen van een of meer discrete variabelen, gebaseerd op de andere attributen in de dataset. Door middel van classificatiealgoritmen kan de dataminingtool grote hoeveelheden gegevens bekijken en u vervolgens laten weten dat bijvoorbeeld: "Klanten die minstens twee generaties productaankopen hebben behouden, hebben de volgende kenmerken: ze hebben een inkomen van minimaal $ 75.000, en ze hebben hun eigen huis."

  • Regressie-algoritmen: Voorspel een of meer continue variabelen, zoals winst of verlies, op basis van andere kenmerken in de gegevensset. Regressiealgoritmen worden aangestuurd door historische informatie die in de loop van de tijd aan het datamining-instrument wordt gepresenteerd, beter bekend als tijdreeks -informatie.

  • Segmentatie-algoritmen: deel gegevens in groepen of clusters van items met vergelijkbare eigenschappen.

  • Associatie-algoritmen: Vind correlaties tussen verschillende attributen in een dataset. De meest voorkomende toepassing van dit soort algoritmen maakt associatiefregels die u kunt gebruiken in een marktmandanalyse. Let op: als een klant bijvoorbeeld een bepaald softwarepakket koopt, heeft hij of zij een kans van 65 procent om binnen twee weken ten minste twee productspecifieke add-on packs te kopen.

  • Sequentieanalysealgoritmen: Vat frequente reeksen of episoden in gegevens samen, zoals een webpadstroom.

Er zijn nog veel meer methoden. Stof het oude statistiekenboek af en begin met lezen.

Data Mining - dummies

Bewerkers keuze

Hoe u Office-antwoorden instelt met Outlook. com - dummies

Hoe u Office-antwoorden instelt met Outlook. com - dummies

Met de desktopversie van Outlook, kunt u uw afwezigheidsbericht instellen om collega's te laten weten wanneer u de stad uit bent (of gewoon niet beschikbaar). U hebt een vergelijkbare tool in Outlook. com - alleen dit heet het antwoord van de geautomatiseerde vakantie en het is een geweldige manier om al je vrienden te laten weten wanneer ...

Sorteren op tabelweergave in Outlook 2013 - dummies

Sorteren op tabelweergave in Outlook 2013 - dummies

Bij sorteren vanuit tabelweergave in Outlook 2013 , klik op de kop van een kolom die u wilt sorteren. De volledige tabel wordt gesorteerd op basis van de kolom waarop u hebt geklikt - op datum, naam of wat dan ook. Hoewel klikken op een kolom de gemakkelijkste manier is om te sorteren, kunt u hiermee op slechts één kolom sorteren. ...

Instellen van Outlook 2013 voor e-mail - dummies

Instellen van Outlook 2013 voor e-mail - dummies

De eerste keer dat u Outlook start 2013 wordt u gevraagd om verschillende instellingsbewerkingen uit te voeren. Het belangrijkste hiervan is om uw e-mailaccount in te stellen. Uw e-mailaccount is het unieke e-mailadres dat u gebruikt om berichten te verzenden en ontvangen. Uw internetprovider (ISP) heeft u waarschijnlijk ten minste één e-mail bezorgd ...

Bewerkers keuze

Niet wilt beheren, waarom u de SharePoint Farm niet wilt beheren - dummies

Niet wilt beheren, waarom u de SharePoint Farm niet wilt beheren - dummies

SharePoint Online farm administration is niet voor bangeriken. Als je kijkt naar de lijst met typische SharePoint-boerderijbeheertaken, zullen je ogen waarschijnlijk glazig worden. In Office 365 beheert Microsoft SharePoint-beheer op bedrijfsniveau. Dit is de waarde van het hebben van SharePoint Online als een service gehost in de cloud. In zekere zin, ...

De Skype voor Bedrijven-gebruikersinterface - dummies

De Skype voor Bedrijven-gebruikersinterface - dummies

Skype voor Bedrijven helpt samenwerking te bevorderen door gebruikers in staat te stellen hun beschikbaarheid te delen, waar en met wie ze werken met collega's. Deze set met informatie wordt aanwezigheid in de toepassing genoemd. In het gedeelte Persoonlijke notities van de gebruikersinterface (zie de volgende afbeelding) zijn tekst en hyperlinks toegestaan, zodat iedereen realtime informatie over ...

Waarom Skype voor Bedrijven Aanwezigheid Drives Productiviteit - Dummies

Waarom Skype voor Bedrijven Aanwezigheid Drives Productiviteit - Dummies

Skype voor Bedrijven is een robuuste communicatie- en vergaderoplossing in Office 365. De aanwezigheidsfunctie in de technologie alleen kan zich vertalen in aanzienlijke tijd- en kostenbesparingen door het proces van informatie-uitwisseling tussen informatiewerkers te stroomlijnen. Stel bijvoorbeeld dat u aan een project werkt en dat u input van vijf teamleden nodig hebt. U ...

Bewerkers keuze

Hoe u uw QuickBooks 2010 Rekeningschema - dummies

Hoe u uw QuickBooks 2010 Rekeningschema - dummies

In QuickBooks 2010 instelt, de lijst met rekeningschema's is een lijst met rekeningen die u gebruikt om uw inkomsten, uitgaven, activa, verplichtingen en het eigen vermogen van de eigenaar te categoriseren. Gelukkig kunt u eenvoudig nieuwe accounts voor uw Chart of Accounts-lijst maken.

Hoe de QuickBooks te installeren 2014 Rekeningschema - dummies

Hoe de QuickBooks te installeren 2014 Rekeningschema - dummies

Het rekeningschema lijst is een lijst met accounts die u gebruikt om uw inkomsten, uitgaven, activa, verplichtingen en eigen vermogen van de eigenaar te categoriseren. Als u een bepaald regelitem met financiële gegevens in een rapport wilt zien, heeft u een account voor dat regelitem nodig. Als u wilt budgetteren op een bepaalde ...

Instellen voor het instellen van de QuickBooks 2014 Leverancierslijst - dummies

Instellen voor het instellen van de QuickBooks 2014 Leverancierslijst - dummies

Net zoals u een klantenlijst gebruikt in QuickBooks om records bij al uw klanten bij te houden, u gebruikt een leverancierslijst om records bij uw leveranciers te bewaren. Net als een klantenlijst kunt u met behulp van een leverancierslijst informatie verzamelen en opnemen, zoals het adres van de leverancier, de contactpersoon, enzovoort. Een leverancier toevoegen ...