Video: Data Warehouse Interview Questions And Answers | Data Warehouse Tutorial | Edureka 2024
Replicatie-middlewareservices combineren selectie en extractie, verplaatsing en laden van de ene database naar een of meer andere, meestal beheerd door een enkel DBMS-product. (De brondatabase en alle doelen zijn bijvoorbeeld allemaal Oracle, alle Sybase of alle Microsoft SQL Server.)
Hoewel de functionaliteit van replicatieservices verschilt tussen DBMS-producten, zijn deze van oudsher momentopname gericht: een momentopname van ofwel een volledige database of de veranderingen sinds de laatste replicatie plaatsvond, worden op een vooraf bepaald tijdstip uit de bron geëxtraheerd en gekopieerd over een netwerkomgeving naar de beoogde doelen.
De gegevens worden vervolgens verzonden en geladen zoals ze zijn (er vindt geen transformatie plaats). Veel databaseleveranciers hebben hun replicatie geïmplementeerd door de logbestanden voor wijzigingen te lezen. Deze replicatiestijl is zeer efficiënt omdat het de overhead van uw transactiesystemen niet verhoogt om de gegevens te repliceren.
Maar replicatie is geen vervanging voor de lange lijst met dat warehousing middleware-services. U wilt replicatie in een data warehousing-omgeving voornamelijk gebruiken bij het vastleggen van wijzigingen in de brondatabase, vaak change data capture (CDC) genoemd, of nadat u de gegevens in uw datawarehouse hebt geladen en vervolgens gegevens hebt geëxtraheerd en verzonden het naar datamarts, zoals getoond in deze figuur.
RDBMS-gebaseerde replicatieservices vangen veranderingen op in het bronsysteem om het gegevensselectie- en extractieproces te optimaliseren.