Inhoudsopgave:
- Gegevenswetenschap en data engineering is niet hetzelfde
- Gegevenswetenschap en bedrijfsinformatie zijn ook niet dezelfde
Video: How to spot a liar | Pamela Meyer 2024
Deel van Data Science For Dummies Cheat Sheet
Traditioneel is big data de term voor gegevens met ongelooflijk veel volume, snelheid en variëteit. Traditionele databasetechnologieën zijn niet geschikt voor het verwerken van big data - meer innovatieve data-engineered oplossingen zijn vereist. Als u uw project wilt evalueren om te beoordelen of het in aanmerking komt voor een big data-project, moet u rekening houden met de volgende criteria:
-
Volume: tussen 1 terabytes / jaar en 10 petabytes / jaar
-
Snelheid: Tussen 30 kilobytes / seconde en 30 gigabytes / seconde
-
Variëteit: Gecombineerde bronnen van ongestructureerde, semi-gestructureerde en gestructureerde gegevens
Gegevenswetenschap en data engineering is niet hetzelfde
Hiring managers hebben de neiging om de rollen van data scientist en data engineer te verwarren. Hoewel het mogelijk is om iemand te vinden die een beetje van beide doet, is elk veld ongelooflijk complex. Het is onwaarschijnlijk dat je iemand met krachtige vaardigheden en ervaring op beide gebieden zult vinden. Om deze reden is het belangrijk om te kunnen identificeren welk type specialist het meest geschikt is om u te helpen uw specifieke doelen te bereiken. De onderstaande beschrijvingen moeten u daarbij helpen.
-
Gegevenswetenschappers: Dataswetenschappers gebruiken codering, kwantitatieve methoden (wiskundig, statistisch en machinaal leren) en zeer gespecialiseerde expertise in hun studiegebied om oplossingen te vinden voor complexe zakelijke en wetenschappelijke problemen.
-
Gegevensingenieurs: Gegevensingenieurs gebruiken vaardigheden in informatica en softwareontwikkeling om systemen te ontwerpen voor en problemen op te lossen met het verwerken en manipuleren van grote gegevenssets.
Gegevenswetenschap en bedrijfsinformatie zijn ook niet dezelfde
Bedrijfsgerichte gegevenswetenschappers en bedrijfsanalisten die bedrijfsinformatie gebruiken zijn net neven en nichten. Beide soorten specialisten gebruiken gegevens om dezelfde zakelijke doelen te bereiken, maar hun benaderingen, technologieën en functies zijn anders. De onderstaande beschrijvingen beschrijven de verschillen tussen de twee rollen.
-
Business intelligence (BI): BI-oplossingen worden over het algemeen gebouwd met behulp van intern gegenereerde gegevenssets - met andere woorden binnen een organisatie dan van buiten. Algemene hulpmiddelen en technologieën zijn online analytische verwerking, extracttransformatie en -belasting en datawarehousing. Hoewel BI soms toekomstgerichte methoden zoals prognostiek omvat, zijn deze methoden gebaseerd op eenvoudige wiskundige gevolgtrekkingen uit historische of huidige gegevens.
-
Bedrijfscentrische gegevenswetenschap: Businesscentrische oplossingen voor gegevenswetenschap worden gebouwd met behulp van datasets die zowel intern als extern zijn aan een organisatie. Algemene hulpmiddelen, technologieën en vaardigheden omvatten cloudgebaseerde analyseplatforms, statistische en mathematische programmering, machine learning, data-analyse met Python en R, en geavanceerde datavisualisatie. Business-centrische data scientists gebruiken geavanceerde wiskundige of statistische methoden om voorspellingen te analyseren en te genereren uit enorme hoeveelheden bedrijfsgegevens.