Video: Pure Storage Partner Programma is schaalbaar 2024
Schaalbaarheid is het vermogen van een applicatie om zich te ontwikkelen flexibel om te voldoen aan de groei- en complexiteitsvereisten. In de context van Excel verwijst schaalbaarheid naar de mogelijkheid van Excel om steeds grotere hoeveelheden gegevens te verwerken.
De meeste Excel-liefhebbers wijzen er snel op dat u vanaf Excel 2007 1, 048, 576 rijen met gegevens in één Excel-werkblad kunt plaatsen - een overweldigende toename ten opzichte van de beperking van 65.536 rijen opgelegd door eerdere versies van Excel. Deze capaciteitsuitbreiding lost echter niet alle schaalbaarheidsproblemen op die Excel overspoelen.
Stel u voor dat u in een klein bedrijf werkt en Excel gebruikt om de dagelijkse transacties te analyseren. Naarmate de tijd vordert, bouwt u een robuust proces, compleet met alle formules, draaitabellen en macro's die u nodig hebt om de gegevens te analyseren die zijn opgeslagen in uw netjes bijgehouden werkblad.
Naarmate de hoeveelheid gegevens toeneemt, zult u eerst prestatieproblemen opmerken. De spreadsheet wordt langzaam geladen en vervolgens langzaam berekend.
Waarom gebeurt dit? Het heeft te maken met de manier waarop Excel met het geheugen omgaat. Wanneer een Excel-bestand is geladen, wordt het volledige bestand in RAM geladen. Excel doet dit om snelle gegevensverwerking en toegang toe te staan. Het nadeel van dit gedrag is dat elke keer dat de gegevens in uw spreadsheet veranderen, Excel het volledige document opnieuw in RAM moet laden. Het netto resultaat in een grote spreadsheet is dat er heel veel RAM-geheugen nodig is om zelfs de kleinste verandering te verwerken. Uiteindelijk wordt elke actie die je in het gigantische werkblad doet, voorafgegaan door een ondraaglijke wacht.
Uw draaitabellen vereisen grotere pivot-caches, waardoor de bestandsgrootte van het Excel-werkboek bijna verdubbeld. Uiteindelijk zal de werkmap te groot worden om gemakkelijk te verspreiden. U kunt zelfs overwegen de werkmap op te splitsen in kleinere werkmappen (mogelijk één voor elke regio). Dit zorgt ervoor dat u uw werk dupliceert.
Na verloop van tijd bereik je uiteindelijk de limiet van 1, 048, 576 rijen van het werkblad. Wat gebeurt er dan? Start je een nieuw werkblad? Hoe analyseer je twee datasets op twee verschillende werkbladen als één geheel? Zijn uw formules nog steeds goed? Moet je nieuwe macro's schrijven?
Dit zijn allemaal zaken die moeten worden aangepakt.
Natuurlijk zult u ook de Excel-energieklanten tegenkomen, die verschillende slimme manieren zullen vinden om deze beperkingen te omzeilen. Uiteindelijk zijn deze methoden echter altijd maar tijdelijke oplossingen. Uiteindelijk zullen zelfs deze energieklanten minder gaan nadenken over de meest effectieve manier om hun gegevens te analyseren en analyseren en meer over hoe ze gegevens "passen" in Excel zonder hun formules en functies te breken.
Excel is flexibel genoeg zodat een bekwame klant de meeste dingen prima kan laten passen. Wanneer klanten echter alleen in termen van Excel denken, beperken ze zichzelf ongetwijfeld, zij het op een ongelooflijk functionele manier.
Bovendien dwingen deze capaciteitsbeperkingen Excel-klanten vaak om de gegevens voor hen te laten voorbereiden. Dat wil zeggen, iemand extraheert grote hoeveelheden gegevens uit een grote database en aggregeert en vormt vervolgens de gegevens voor gebruik in Excel.
Moet de serieuze analist altijd afhankelijk zijn van iemand anders voor haar gegevensbehoeften? Wat als een analist de tools zou kunnen krijgen om toegang te krijgen tot enorme hoeveelheden gegevens zonder afhankelijk te zijn van anderen om gegevens te verstrekken? Kan die analist waardevoller zijn voor de organisatie? Zou die analist zich kunnen concentreren op de nauwkeurigheid van de analyse en de kwaliteit van de presentatie in plaats van het routeren van Excel-gegevensonderhoud?
Een relationeel databasesysteem (zoals Access of SQL Server) is een logische volgende stap voor de analist die te maken heeft met een steeds groter wordende datapool. Databasesystemen hebben meestal geen invloed op de prestaties van grote hoeveelheden opgeslagen gegevens en zijn gebouwd om grote hoeveelheden gegevens te verwerken. Een analist kan dan grotere datasets verwerken zonder dat de gegevens moeten worden samengevat of voorbereid om in Excel te passen.
Ook als een proces ooit belangrijker wordt voor de organisatie en moet worden bijgehouden in een omgeving die acceptabel is voor het bedrijf, zal het gemakkelijker zijn om te upgraden en op te schalen als dat proces al in een relationeel databasesysteem is.