Video: Getting started with BigQuery/GA360 integration 2024
Hoewel de wereld van big data en het traditionele datawarehouse elkaar kruisen, zijn ze onwaarschijnlijk dat ze snel zullen samenvoegen. Beschouw een datawarehouse als een record voor business intelligence, net zoals een CRM-systeem (Customer Relationship Management) of een boekhoudsysteem. Deze systemen zijn zeer gestructureerd en geoptimaliseerd voor specifieke doeleinden. Bovendien zijn deze systemen van registratie over het algemeen sterk gecentraliseerd.
Het diagram toont een typische benadering van gegevensstromen met magazijnen en marts:
Organisaties zullen onvermijdelijk datawarehouses blijven gebruiken om het type gestructureerde en operationele gegevens te beheren dat recordsystemen kenmerkt. Deze datawarehouses bieden bedrijfsanalisten nog steeds de mogelijkheid om belangrijke gegevens, trends, enzovoort te analyseren. De opkomst van big data vormt echter een uitdaging voor de rol van het datawarehouse en biedt een aanvullende aanpak.
Zie de relatie tussen het datawarehouse en big data als samenvoeging om een hybride structuur te worden. In dit hybride model blijven de zeer gestructureerde, geoptimaliseerde operationele gegevens in het strak gecontroleerde gegevensmagazijn, terwijl de gegevens die in hoge mate worden verspreid en onderhevig aan wijzigingen in realtime worden beheerd door een Hadoop-gebaseerde (of vergelijkbare NoSQL) infrastructuur.
Het is onvermijdelijk dat operationele en gestructureerde gegevens moeten samenwerken in de wereld van big data, waar de informatiebronnen niet (noodzakelijkerwijs) zijn gereinigd of geprofileerd. Organisaties begrijpen steeds meer dat ze een zakelijke vereiste hebben om traditionele datawarehouses te kunnen combineren met hun historische bedrijfsgegevensbronnen met minder gestructureerde en doorgelichte big data-bronnen. Een hybride aanpak die traditionele en grote gegevensbronnen ondersteunt, kan helpen om deze bedrijfsdoelen te bereiken.