Video: Kenneth Cukier: Big data is better data 2024
Er zijn dwingende redenen waarom SQL bewezen heeft veerkrachtig te zijn. De IT-industrie heeft 40 jaar ervaring met SQL, sinds het voor het eerst werd ontwikkeld door IBM in de vroege jaren 1970. Met de toename van het gebruik van relationele databases in de jaren tachtig is SQL sindsdien een standaardvaardigheid geworden voor de meeste IT-professionals.
U kunt gemakkelijk zien waarom SQL zo succesvol is: het is relatief eenvoudig te leren en SQL-query's zijn vrij leesbaar. Dit gemak is terug te voeren op een kernontwerppunt in SQL: het is een declaratieve taal, in tegenstelling tot een imperatieve taal.
Een declaratieve taal houdt in dat uw vragen alleen betrekking hebben op de aard van de gevraagde gegevens - idealiter zou er niets in uw zoekopdracht moeten zijn dat bepaalt hoe de verwerking moet worden uitgevoerd. Met andere woorden, alles wat u in SQL aangeeft, is welke informatie u terug wilt hebben van het systeem - niet hoe u het kunt krijgen.
In tegenstelling, met een imperatieve taal (C, bijvoorbeeld, of Java, of Python), bestaat je code uit instructies waarin je de acties definieert die je nodig hebt om het systeem uit te voeren.
Naast de (gemakkelijk leveraged) vaardigheden van uw SQL-vriendelijke IT-professionals, zijn decennia aan database-applicaties ook gebouwd met SQL-interfaces. Wanneer het gaat over hoe Hadoop het datawarehouse kan aanvullen, is het duidelijk dat organisaties gestructureerde gegevens in Hadoop opslaan. En als gevolg daarvan zullen ze een deel van hun bestaande toepassingslogica uitvoeren tegen Hadoop.
Niemand wil betalen dat applicaties worden herschreven, dus een SQL-interface is zeer wenselijk.
Met de ontwikkeling van SQL-interfaces naar Hadoop-gegevens is een interessante trend dat commerciële business analytics en datamanagementtools bijna allemaal op de Hadoop-bandwagon springen, inclusief rapportage van bedrijfsinformatie; statistische pakketten; Extract, Transform en Load frameworks (ETL); en een verscheidenheid aan andere tools. In de meeste gevallen is de interface met de Hadoop-gegevens Hive.