Inhoudsopgave:
- Entiteitsextractie en verrijking
- Zoeken en waarschuwen
- Geaggregeerde functies
- Diagrammen en bedrijfsinformatie
Video: Web Programming - Computer Science for Business Leaders 2016 2024
Het opslaan en ophalen van grote hoeveelheden gegevens en het zo snel doen is geweldig, en als je eenmaal je nieuw beheerde gegevens in NoSQL hebt, kun je geweldige dingen doen.
Entiteitsextractie en verrijking
U kunt databaseactiveringen, waarschuwingsacties en externe systemen gebruiken om brongegevens te analyseren. Misschien is het meestal vrije tekst, maar worden bekende onderwerpen genoemd. Deze triggers en waarschuwingsacties kunnen de tekst markeren als een persoon of organisatie, die de inhoud zelf tagt en het document dat erin ligt.
Een goed voorbeeld is de inhoud van een nieuwsartikel. U kunt een hulpmiddel zoals Apache Stanbol of OpenCalais gebruiken om sleutelbegrippen te identificeren. Deze hulpmiddelen kunnen "president Poetin" zien en besluiten dat dit verband houdt met een persoon genaamd Vladimir Poetin, die Russisch is, en de huidige president van de Russische Federatie is.
Andere voorbeelden zijn namen van aandoeningen en medicatie, organisaties, gespreksonderwerpen, genoemde producten en of een opmerking positief of negatief was.
Dit zijn allemaal voorbeelden van entiteitsextractie (dit is het proces van het automatisch extraheren van typen objecten uit hun tekstuele namen) . Door sleutelwoorden te identificeren, kunt u deze taggen of in een XML-element omwikkelen, waardoor u inhoud effectiever kunt doorzoeken.
Entiteitverrijking betekent dat naast het identificeren van informatie ook informatie op basis van de originele tekst wordt toegevoegd. In het voorbeeld van Poetin kunt u het gewone tekstwoord "Putin" in president Poetin veranderen. Als alternatief kunt u "Londen" veranderen in Londen.
U kunt deze gegevens weergeven in een gebruikersinterface als gemarkeerde tekst met een koppeling naar verdere informatie over elk onderwerp.
U kunt verrijking bieden door gebruik te maken van zoeken in vrije tekst, waarschuwingen, databasetriggers en integraties met externe software zoals TEMIS Luxid en SmartLogic.
Zoeken en waarschuwen
Nadat u uw gegevens hebt opgeslagen, wilt u deze wellicht doorzoeken. Vrije tekst zoeken is eenvoudig, maar na het uitvoeren van entiteitsextractie hebt u meer opties. U kunt specifiek zoeken naar een persoon met de naam "Oranje" (zoals in William of Orange) in plaats van te zoeken naar records met de term oranje - wat natuurlijk ook een kleur en een vrucht is.
Dit resulteert in een gedetailleerdere zoekopdracht. Het maakt ook faceted navigatie mogelijk. Als je naar Amazon gaat en naar Harry Potter zoekt, zie je categorieën voor boeken, films, games enzovoort. De -productcategorie is een voorbeeld van een facet , waarin u een aspect van de gegevens in de zoekresultaten ziet, dat wil zeggen de meest voorkomende waarden van elk facet in alle zoekresultaten, zelfs degenen die niet op de huidige pagina staan.
Gebruikersinterfaces kunnen ondersteuning bieden voor uitgebreide verkenningen in gegevens (evenals eenvoudige Google-achtige zoekopdrachten). Gebruikers kunnen ze ook gebruiken om eerdere zoekopdrachten op te slaan en te laden.
U kunt opgeslagen zoekcriteria instellen zodat waarschuwingen worden geactiveerd wanneer nieuw toegevoegde records aan die criteria voldoen. Dus als er een nieuwe record arriveert die overeenkomt met uw zoekcriteria, vindt er een actie plaats. Misschien wordt "Putin" Poetin
Niet alle zoekmachines kunnen elke zoekterm een waarschuwing geven. Sommige zijn beperkt tot tekstvelden; anderen kunnen geen georuimtelijke criteria hanteren. Zorg ervoor dat de jouwe de waarschuwingen kan verwerken die je nodig hebt om te configureren.
Geaggregeerde functies
Zodra u relevante informatie vindt, wilt u misschien dieper graven. Afhankelijk van de bron kun je je afvragen hoeveel landen een BBP van meer dan $ 400 miljard hebben, of wat de gemiddelde leeftijd is van alle leden in je stamboom, of waar de meeste slangenbeten voorkomen in Australië. Deze voorbeelden illustreren hoe analyses worden uitgevoerd over een reeks zoekresultaten. Dit zijn respectievelijk telling, gemiddelde en georuimtelijke warmtekaartberekeningen.
Het kunnen bieden van dergelijke berekeningen naast de gegevens biedt verschillende voordelen. Het eerste voordeel is dat je de indexen kunt gebruiken om dingen te versnellen. Ten tweede zullen deze indices waarschijnlijk in het cachegeheugen worden opgeslagen, waardoor ze nog sneller worden. Ten derde zijn geheugenindexen bijzonder nuttig voor een NoSQL-database met Hadoop File System (HDFS) -opslag. HDFS doet geen native indexering of in-memory kolomopslag voor snelle aggregatieberekeningen zelf - hiervoor is een NoSQL-database nodig.
Gefacetteerde navigatie is een voorbeeld van op tellingen gebaseerde aggregaties over zoekresultaten die worden weergegeven in een gebruikersinterface. Hetzelfde geldt voor een tijdlijn die het aantal records toont dat een bepaald tijdstip vermeldt. Wilt u bijvoorbeeld resultaten van dit jaar, deze maand of dit uur weergeven?
Als u deze functionaliteit wilt, moet u ervoor zorgen dat uw database aggregaten efficiënt naast de gegevens kan berekenen. De meeste NoSQL-databases doen dit, maar sommige niet.
Diagrammen en bedrijfsinformatie
De volgende voor de hand liggende uitbreiding van de gebruikersinterface omvat het in kaart brengen en bekijken van tabellenoverzichten voor live managementinformatie en analyse van historische business intelligence.
De meeste NoSQL-databases bieden een eenvoudig te integreren REST API in hun -databases. Dit betekent dat u een reeks applicatieniveaus kunt invoegen, of zelfs JavaScript-toepassingen rechtstreeks aan deze databases kunt koppelen. Een verscheidenheid aan uitstekende grafiekenbibliotheken is beschikbaar voor JavaScript. U kunt het R-ecosysteem zelfs gebruiken om diagrammen te maken op basis van gegevens in deze databases, nadat u een geschikte databaseaansluiting hebt geïnstalleerd.
Sommige NoSQL-databases bieden zelfs een plug-in voor ODBC of JDBC relationele databases. Indexen maken binnen een gegeven record en deze weergeven als een -relationele weergave is een handige manier om ongestructureerde gegevens in een NoSQL-documentendatabase om te zetten in gegevens die kunnen worden geanalyseerd met een Business Intelligence-tool.
Controleer of uw NoSQL-databaseleverancier visualisatietools biedt of zakenpartners heeft met hulpprogramma's die verbinding kunnen maken met deze databases. In vogue-tools zijn onder andere Tableau Server, een moderne, gedeelde business-intelligence-server die het publiceren van interactieve rapporten over gegevens in verschillende databases, waaronder NoSQL-databases, ondersteunt.