Video: Next Generation Data Warehouse Appliance Webinar 2024
Net als bij jeans met een klokbodem, komen hardware-ondersteunde databases op het comeback-parcours. Microsoft, Oracle en Netezza zijn allemaal razernij bij database-seminars over de hele wereld. In het midden tot het einde van de jaren tachtig waren de verkopers Britton Lee en Teradata (die uiteindelijk fuseerden) allemaal razend populair.
Ze leverden toegewijde machines die de databaseverwerking optimaliseerden - de eerste machines die worden gebruikt door zware dataconsumenten, waaronder veel van de bedrijven met consumentengoederen.
Het doel van deze vakken was om alle aspecten van een computer te wijden aan het sneller verkrijgen van gegevens bij de gebruikers. Deze speciale machine omvatte een query-gecentreerde database, geheugen, CPU en schijfbewerkingen. Uiteindelijk raakten dergelijke producten uit de mode en werden de databasebeheersystemen gemigreerd naar een meer open, run-on-any-box-architectuur.
Nu zijn ze terug!
Een datawarehouse-appliance is een geïntegreerde set servers, opslag, besturingssysteem, DBMS en speciaal voorgeïnstalleerde software die vooraf is geoptimaliseerd voor datawarehousing. Datawarehouse-appliances bieden oplossingen voor de middelgrote tot grote volumes datawarehouse-markt en bieden low-cost prestaties op datavolumes in het terabyte tot petabyte bereik (dat zijn veel gegevens!).
De meeste leveranciers van datawarehouse-apparaten gebruiken massaal parallelle verwerking (MPP) -architecturen om hoge queryprestaties en schaalbaarheid van platforms te bieden. MPP-architecturen bestaan uit onafhankelijke processors of servers die parallel worden uitgevoerd.
De meeste MPP-architecturen implementeren een shared nothing-architectuur, waarin elke server zelfvoorzienend is en zijn eigen geheugen en schijf beheert. Gedeelde niets-architecturen hebben een bewezen reputatie op het gebied van hoge schaalbaarheid en geringe betwisting.
De meeste datawarehouse-apparaten distribueren gegevens naar speciale schijfopslageenheden die op elke server in het apparaat zijn aangesloten. Met deze distributie kunnen de apparaten een relationele query oplossen door gegevens op elke server parallel te scannen. De splitsen-en-heersen benadering levert hoge prestaties en schalen lineair wanneer u nieuwe servers toevoegt aan de architectuur.
En vanuit een prijstechnisch perspectief proberen de meeste leveranciers in deze arena een strategie van plug-and-play te ontwikkelen. Netezza verkoopt bijvoorbeeld een nieuwe gebruiker zijn product gewoonlijk als plugcompatibel met Teradata voor minder dan de onderhoudskosten van Teradata. Deze prijs maakt de producten zeer aantrekkelijk, waardoor ze een groeiend acceptatiegraad hebben.