Huis Persoonlijke financiën Werken met grafiekgegevens in Python voor gegevenswetenschap - dummies

Werken met grafiekgegevens in Python voor gegevenswetenschap - dummies

Inhoudsopgave:

Video: Een draaitabel maken met meerdere werkbladen Excel 2016 2024

Video: Een draaitabel maken met meerdere werkbladen Excel 2016 2024
Anonim

De meeste gegevenswetenschappers moeten op een gegeven moment met grafiekgegevens werken. Python geeft je die functionaliteit. Stel u datapunten voor die verbonden zijn met andere gegevenspunten, zoals hoe een webpagina via hyperlinks met een andere webpagina is verbonden. Elk van deze gegevenspunten is een -knooppunt . De knooppunten worden met elkaar verbonden via links .

Niet elk knooppunt linkt naar elk ander knooppunt, dus de knooppuntverbindingen worden belangrijk. Door de knooppunten en hun links te analyseren, kunt u allerlei interessante taken uitvoeren op het gebied van gegevenswetenschap, zoals het bepalen van de beste manier om van het werk naar uw huis te komen met behulp van straten en snelwegen.

De aangrenzingsmatrix begrijpen> Een

aanpasmatrix vertegenwoordigt de verbindingen tussen knooppunten van een grafiek. Wanneer er een verbinding is tussen het ene knooppunt en het andere, geeft de matrix dit aan als een waarde groter dan 0. De precieze weergave van verbindingen in de matrix hangt af van de vraag of de grafiek is gericht (waarbij de richting van de verbinding ertoe doet) of niet-gericht. Een probleem met veel online voorbeelden is dat de auteurs ze eenvoudig houden voor uitlegdoeleinden. Real-world grafieken zijn echter vaak enorm en trotseren gemakkelijke analyse eenvoudigweg door visualisatie. Denk maar eens aan het aantal knooppunten dat zelfs een kleine stad zou hebben als je straatkruisingen overweegt. Veel andere grafieken zijn veel groter en alleen al het bekijken ervan onthult nooit interessante patronen. Datawetenschappers noemen het probleem bij het presenteren van een complexe grafiek met behulp van een aangrenzende matrix een

haarbal .

Een sleutel tot het analyseren van buurmatrices is om ze op specifieke manieren te sorteren. U kunt er bijvoorbeeld voor kiezen de gegevens te sorteren op andere eigenschappen dan de daadwerkelijke verbindingen. Een grafiek van straatverbindingen kan de datum omvatten waarop de straat voor het laatst met de gegevens was geplaveid, waardoor u patronen kunt zoeken die iemand sturen op basis van de straten die het best zijn gerepareerd. Kort gezegd, het nuttig maken van de grafiekgegevens wordt een kwestie van het manipuleren van de organisatie van die gegevens op specifieke manieren.

Basisprincipes van NetworkX gebruiken

Werken met grafieken kan moeilijk worden als u de code helemaal opnieuw moet schrijven. Gelukkig maakt het NetworkX-pakket voor Python het gemakkelijk om de structuur, dynamiek en functies van complexe netwerken (of grafieken) te maken, te manipuleren en te bestuderen. U kunt het pakket ook gebruiken om met digraphs en multigraphs te werken.

De nadruk van NetworkX ligt op het voorkomen van het hele probleem van haarballen.Het gebruik van eenvoudige oproepen verbergt veel van de complexiteit van het werken met grafieken en naburige matrices uit beeld. In het volgende voorbeeld ziet u hoe u een standaard aanpasmatrix maakt vanuit een van de door NetworkX geleverde grafieken:

importeer netwerkx als nx G = nx. cycle_graph (10) A = nx. adjacency_matrix (G) print (A. todense ())

Het voorbeeld begint met het importeren van het vereiste pakket. Vervolgens wordt een grafiek gemaakt met behulp van de sjabloon cycle_graph (). De grafiek bevat tien knooppunten. Als u adjacency_matrix () aanroept, wordt de aanpasmatrix uit de grafiek gemaakt. De laatste stap is om de uitvoer als een matrix af te drukken, zoals hier wordt weergegeven:

[[0 1 0 0 0 0 0 0 0 1] [1 0 1 0 0 0 0 0 0 0] [0 1 0 1 0 0 0 0 0 0] [0 0 1 0 1 0 0 0 0 0] [0 0 0 1 0 1 0 0 0 0] [0 0 0 0 1 0 1 0 0 0] [0 0 0 0 0 1 0 1 0 0] [0 0 0 0 0 0 1 0 1 0] [0 0 0 0 0 0 0 1 0 1] [1 0 0 0 0 0 0 0 1 0]]

U hoeft niet bouw vanuit scratch een eigen grafiek voor testdoeleinden. De NetworkX-site documenteert een aantal standaardgrafiektypen die u kunt gebruiken, die allemaal beschikbaar zijn binnen IPython.

Het is interessant om te zien hoe de grafiek eruitziet nadat u deze hebt gegenereerd. De volgende code geeft de grafiek voor u weer.

De oorspronkelijke grafiek plotten.

matplotlib importeren. pyplot als plt nx. draw_networkx (G) plt. show ()
De plot laat zien dat je een edge kunt toevoegen tussen knooppunten 1 en 5. Dit is de code die nodig is om deze taak uit te voeren met de functie add_edge ().

De grafiektoevoeging plotten.

G. add_edge (1, 5) nx. draw_networkx (G) plt. Show ()
Werken met grafiekgegevens in Python voor gegevenswetenschap - dummies

Bewerkers keuze

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Hoe u uw LinkedIn-profiel kunt vermarkten voor de markt - dummies

Wanneer het komt om het voordeel dat u van LinkedIn krijgt te maximaliseren, bent u uw grootste pleitbezorger. Hoewel je netwerk van connecties je helpt te groeien, gebeurt veel van je marketing zonder dat je erbij betrokken bent. Nadat je je profiel hebt aangemaakt, worden die en andere LinkedIn-activiteit van je gelezen en beoordeeld door de ...

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Hoe u uw LinkedIn-netwerk kunt bouwen voordat u naar een nieuwe stad gaat - dummies

Deze dagen, wanneer u naar een nieuwe stad moet verhuizen, kunt u er veel plannen voor maken op LinkedIn en op internet. Je kunt de buurten onderzoeken, de schoolsystemen bekijken en online naar huizen gaan. Je kunt een stap verder gaan als je van plan bent om naar een andere ...

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

Hoe u uw LinkedIn-contactinstellingen controleert - dummies

U zeker wilt dat u de juiste instellingen selecteert contactinstellingen voor uw LinkedIn-profiel. Als u bijvoorbeeld op zoek bent naar een nieuwe baan, wilt u er zeker van zijn dat de optie voor Carrièremogelijkheden is gecontroleerd. Wanneer u klaar bent om uw contactinstellingen te controleren, volgt u deze stappen: Ga naar ...

Bewerkers keuze

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Canon EOS Rebel XS / 1000D voor Dummy's Cheat Sheet - dummies

Uw Canon EOS Rebel XS / 1000D heeft alle functies die u kunt gebruiken om fantastische foto's te maken. Je moet de beeldmodus instellen op het onderwerp van je foto en de Canon EOS Rebel XS / 1000D laat je volledig of gedeeltelijk automatisch gaan met de belichtingsinstellingen.

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Canon Rebel T3-serie camera's: Live-modus Autofocus in Live View - dummies

Live-modus Met autofocus kunt u de focus instellen op uw Canon EOS Rebel T3 of T3i zonder tijdelijk het voorbeeld van de monitor te verliezen. Bovendien, in plaats van het selecteren van negen autofocuspunten, verplaatst u eenvoudig een enkel scherpstelpunt over uw onderwerp. Aan de andere kant is de autofocus van de Live-modus merkbaar langzamer dan in de Quick-modus, en ...

Bewerkers keuze

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Wijzigt Hoe tekstgrootte te wijzigen in Word 2016 - dummies

Tekstgrootte wordt ingesteld in uw Word 2016 document gebaseerd over de meting van de oude letterzetter, ook wel punten genoemd. Hier zijn enkele aandachtspunten waarmee u rekening moet houden bij het opmaken van tekst in Word: hoe groter de puntgrootte, hoe groter de tekst. De meeste gedrukte tekst is 10 of 12 punten lang. Koppen zijn meestal 14 ...

Grammatica controleren in Word 2007 - dummies

Grammatica controleren in Word 2007 - dummies

Naast het controleren op correcte spelling, kunt u met Word 2007 ook om uw documenten te bewijzen om grammaticale fouten te voorkomen. U kunt de grammaticasuggesties van Word bekijken terwijl u door het document bladert, of u kunt een traditionele spellingcontrole uitvoeren. Word biedt u zelfs de kans om de gemarkeerde fout te onderzoeken en meer te leren van ...

Spelling controleren terwijl u typt in Word 2013 - dummies

Spelling controleren terwijl u typt in Word 2013 - dummies

Woord 2013 heeft een interne bibliotheek vol met ontelbare woorden, allemaal correct gespeld. Telkens wanneer u een woord typt, wordt het vergeleken met dat woordenboek. Wanneer het woord niet wordt gevonden, wordt dit als verdacht gemarkeerd in uw document. Het merk is een rode zigzaglijn. Mijn advies: blijf typen. Laat de "rode zigzag van een ...