Video: What is Data Mining? 2024
Gegevens die door grote organisaties worden verzameld in het dagelijkse leven, worden meestal opgeslagen in databases, maar databestuurders zijn mogelijk niet bereid om data-mijnwerkers directe toegang tot deze gegevens te geven. gegevensbronnen en rechtstreekse toegang is volgens u ook niet de beste optie. Directe toegang tot operationele (gebruikt voor routinematige bedrijfsoperaties) databases kan een slecht idee zijn, omdat
-
gegevens mijnwerkers veel gegevens gebruiken. > U kunt onbedoeld hulpmiddelen vastmaken en de normale bedrijfsvoering verstoren.
-
U kunt onbedoeld een wet op gegevensprivacy of ander gegevensbeheer overtreden. vereiste als uw gegevenstoegang niet goed wordt beheerd. Er zijn geen operationele databases georganiseerd voor datamining.
-
U zou veel tijd kunnen besteden aan het verzamelen van de gegevens die u nodig hebt en u kunt er nog steeds niet zeker van zijn dat u deze gegevens juist krijgt. Wanneer u gegevens nodig hebt van een operationele database (en u hebt de juiste goedkeuring om de gegevens te gebruiken), u moet uw behoeften bespreken met de beheerder die verantwoordelijk is voor die gegevens. U moet precies uitleggen welke gegevens u nodig hebt, welke indeling u nodig hebt voor datamining en of u de gegevens slechts één keer of doorlopend nodig hebt.
Lopende gegevenstoegang is een andere kwestie. De beheerder wil mogelijk niet altijd gegevensuittreksels verstrekken, en u directe toegang geven tot bedrijfssystemen is riskant. Een veelvoorkomende oplossing is het maken van een
analytische database. Dit is een gewone relationele database die losstaat van conventionele bedrijfssystemen. Gegevens worden routinematig (en automatisch) overgebracht van bedrijfssystemen naar de analytische database en gegevensmijnwerkers hebben er op elk moment toegang toe.
Als de databasebeheerder erop staat dat de gegevens niet op deze manier kunnen worden opgeslagen, vraag dan of het mogelijk is om een
weergave te maken (een opgeslagen query die kan worden opgevraagd alsof het een conventionele gegevenstabel is) met de organisatie die je nodig hebt. Veel dataminingproducten kunnen gegevens uit databases lezen. De vereiste stappen variëren op basis van het
Ontwerp van de datamining-app
-
Structuur van de brondatabase
-
Middleware, meestal een
-
stuurprogramma ( ODBC-stuurprogramma, JDBC-stuurprogramma <), speciale software die bemiddelt tussen de database en toepassingssoftware Documentatie voor uw dataminingtoepassing moet u vertellen of het gegevens uit een database kan lezen en, zo ja, welk gereedschap of welke functie moet worden gebruikt en hoe.De beheerder die de analytics-database instelt, kan details verstrekken over toegang tot de database. Als u al vertrouwd bent met het werken met databases en andere toepassingen, zult u niets verrassends vinden als u dezelfde dingen doet met een datamining-applicatie. Als databases nieuw voor u zijn, haalt u een bekwaam persoon uit uw organisatie om u door het proces te leiden met uw eigen database en datamining-applicatie.