Video: Notion Databases: Workshop 2024
U hebt misschien gelezen dat maatregelen die op een Excel-dashboard worden gebruikt absoluut het oorspronkelijke doel van dat dashboard moeten ondersteunen. Hetzelfde concept is van toepassing op het back-enddatamodel. U moet alleen gegevens importeren die nodig zijn om aan het doel van uw dashboard of rapport te voldoen.
In een poging om zoveel mogelijk gegevens bij de hand te hebben, brengen veel Excel-gebruikers elk stuk gegevens dat ze kunnen krijgen in hun spreadsheets. U kunt deze mensen herkennen aan de 40-megabyte bestanden die ze via e-mail verzenden. U hebt deze spreadsheets gezien: twee tabbladen met een rapportage- of dashboardinterface en vervolgens zes verborgen tabbladen met duizenden regels met gegevens (waarvan de meeste niet worden gebruikt). Ze bouwen in essentie een database in hun spreadsheet.
Wat is er mis met het gebruik van zoveel mogelijk gegevens? Welnu, hier zijn een paar problemen:
-
Aggregatie van gegevens binnen Excel verhoogt het aantal formules. Als u alle onbewerkte gegevens invoert, moet u die gegevens samenvoegen in Excel. Dit leidt onvermijdelijk tot een exponentiële toename van het aantal formules dat u moet gebruiken en onderhouden.
Houd er rekening mee dat uw gegevensmodel een hulpmiddel is voor het presenteren van analyses en niet voor het verwerken van onbewerkte gegevens. De gegevens die het beste werken in rapportagemechanismen, is wat al is geaggregeerd en samengevat in bruikbare weergaven die kunnen worden genavigeerd en aan dashboardonderdelen kunnen worden toegevoegd. Het importeren van gegevens die al zo veel mogelijk zijn geaggregeerd, is veel beter.
Als u bijvoorbeeld wilt rapporteren over omzet per regio en maand, hoeft u geen verkooptransacties in uw gegevensmodel te importeren. Gebruik in plaats daarvan een geaggregeerde tabel die bestaat uit Regio, Maand en Som van de omzet.
-
Uw gegevensmodel wordt met uw dashboard gedistribueerd. Met andere woorden, omdat uw dashboard wordt gevoed door uw gegevensmodel, moet u het model achter de schermen (waarschijnlijk in verborgen tabbladen) onderhouden wanneer u het dashboard distribueert. Afgezien van het feit dat de bestandsgrootte onhandelbaar wordt, kan het opnemen van te veel gegevens in uw datamodel de prestaties van uw dashboard juist verslechteren. Waarom?
Wanneer u een Excel-bestand opent, wordt het volledige bestand in het geheugen geladen om een snelle gegevensverwerking en toegang te garanderen. Het nadeel van dit gedrag is dat Excel een grote hoeveelheid RAM vereist om zelfs de kleinste verandering in uw spreadsheet te verwerken. U hebt misschien gemerkt dat wanneer u een actie probeert uit te voeren op een grote, formule-intensieve gegevensset, Excel traag reageert en u een berekeningsindicator op de statusbalk geeft.Hoe groter uw dataset, des te minder efficiënt is het data-crunchen in Excel.
-
Grote datasets kunnen de schaalbaarheid bemoeilijken. Stel u voor dat u in een klein bedrijf werkt en dat u maandelijkse transacties in uw gegevensmodel gebruikt. Elke maand bevat 80, 000 regels met gegevens. Naarmate de tijd vordert, bouwt u een robuust proces, compleet met alle formules, draaitabellen en macro's die u nodig hebt om de gegevens te analyseren die zijn opgeslagen op uw netjes onderhouden tabblad.
Wat gebeurt er na een jaar? Start je een nieuw tabblad? Hoe analyseer je twee datasets op twee verschillende tabbladen als één entiteit? Zijn uw formules nog steeds goed? Moet u nieuwe macro's schrijven?
Dit zijn allemaal problemen die kunnen worden vermeden door alleen verzamelde en samengevatte gegevens te importeren die nuttig zijn voor het belangrijkste doel van uw rapportagevereisten.