Huis Persoonlijke financiën Principale componentenanalyse toepassen op voorspellende analyses - dummies

Principale componentenanalyse toepassen op voorspellende analyses - dummies

Video: Michael Sikora | Sequencing Clonally Expanded T Cells in ME/CFS 2025

Video: Michael Sikora | Sequencing Clonally Expanded T Cells in ME/CFS 2025
Anonim

hoofdcomponentenanalyse (PCA) verlagen. Dit is een waardevolle techniek die veel wordt gebruikt in voorspellende analyses en gegevenswetenschap. Het bestudeert een dataset om de meest relevante variabelen te leren die verantwoordelijk zijn voor de hoogste variatie in die dataset. PCA wordt meestal gebruikt als een techniek voor gegevensvermindering.

Terwijl u voorspellende modellen maakt, moet u mogelijk het aantal functies dat uw gegevensset beschrijft, verminderen. Het is zeer nuttig om deze hoge dimensionaliteit van gegevens te verminderen door middel van approximatietechnieken, waar PCA in uitblinkt. De benaderde gegevens vatten alle belangrijke variaties van de originele gegevens samen.

De functies van gegevens over aandelen kunnen bijvoorbeeld aandelenkoersen, dagelijkse hoogtepunten en dieptepunten zijn, handelsvolumes, 200-daags voortschrijdend gemiddelde, prijs / winstverhoudingen, relatieve sterkte ten opzichte van andere markten., rentetarieven en sterkte van valuta.

Het vinden van de belangrijkste voorspellende variabelen is de kern van het bouwen van een voorspellend model. De manier waarop velen het hebben gedaan is door een brute force-benadering te gebruiken. Het idee is om te beginnen met zoveel mogelijk relevante variabelen en vervolgens een trechterbenadering te gebruiken om functies te verwijderen die geen invloed of geen voorspellende waarde hebben.

De intelligentie en het inzicht worden naar deze methode gebracht door belanghebbenden uit het bedrijfsleven te engageren, omdat ze een voorgevoel hebben over welke variabelen de grootste impact zullen hebben in de analyse. De ervaring van de gegevenswetenschappers die bij het project betrokken zijn, is ook belangrijk om te weten met welke variabelen ze moeten werken en welke algoritmen moeten worden gebruikt voor een specifiek gegevenstype of een domeinspecifiek probleem.

Om te helpen met het proces, gebruiken data scientists veel voorspellende analytische tools die het gemakkelijker en sneller maken om meerdere permutaties en analyses uit te voeren op een dataset om de impact van elke variabele op die dataset te meten.

Wetende dat er een grote hoeveelheid gegevens is om mee te werken, kunt u PCA gebruiken voor hulp.

Het aantal variabelen verminderen dat u bekijkt, is voldoende reden om PCA te gebruiken. Als u PCA gebruikt, beschermt u zichzelf bovendien automatisch tegen overfitteren van het model.

Zeker, je zou een verband kunnen vinden tussen weergegevens in een bepaald land en de prestaties van de aandelenmarkt. Of met de kleur van iemands schoenen en de route die hij of zij naar kantoor neemt, en de prestaties van hun portfolio voor die dag. Het opnemen van die variabelen in een voorspellend model is echter meer dan overfitteren, het is misleidend en leidt tot valse voorspellingen.

PCA gebruikt een wiskundig geldige benadering om de subset van uw gegevensset te bepalen die de belangrijkste functies bevat; bij het bouwen van uw model op die kleinere gegevensset, heeft u een model dat voorspellende waarde heeft voor de algehele, grotere gegevensset waarmee u werkt. Kort gezegd, PCA moet u helpen uw variabelen duidelijk te maken door de subset van variabelen te identificeren die verantwoordelijk zijn voor de meeste variatie met uw oorspronkelijke gegevensset. Het helpt u overtolligheid te herkennen. Het helpt je erachter te komen dat twee (of meer variabelen) je hetzelfde vertellen.

Bovendien voert de analyse van hoofdcomponenten uw multidimensionale gegevensset uit en produceert een nieuwe gegevensset waarvan de variabelen representatief zijn voor de lineariteit van de variabelen in de oorspronkelijke gegevensset. Bovendien heeft de uitgevoerde gegevensset afzonderlijk niet-gecorreleerde variabelen en wordt hun variantie gesorteerd op basis van hun hoofdcomponenten, waarbij de eerste de grootste is, enzovoort. In dit opzicht kan PCA ook worden beschouwd als een techniek voor het construeren van functies.

Terwijl u PCA of andere vergelijkbare technieken gebruikt die de dimensionaliteit van de gegevensset helpen verminderen, moet u altijd voorzichtig zijn om de prestaties van het model niet negatief te beïnvloeden. Het verkleinen van de gegevens mag niet ten koste gaan van een negatieve invloed op de prestaties (de nauwkeurigheid van het voorspellende model). Loop voorzichtig en beheer uw dataset met zorg.

De toegenomen complexiteit van een model vertaalt zich niet in een hogere kwaliteit van het resultaat.

Om de prestaties van het model te behouden, moet u mogelijk de effectiviteit van elke variabele zorgvuldig evalueren, en de bruikbaarheid ervan in de vormgeving van het uiteindelijke model meten.

Wetende dat de PCA bijzonder nuttig kan zijn wanneer de variabelen sterk gecorreleerd zijn binnen een gegeven dataset, kan het hebben van een dataset met niet-gecorreleerde voorspellende variabelen de taak van het reduceren van de dimensionaliteit van multivariate gegevens alleen maar bemoeilijken. Naast de PCA kunnen nog veel andere technieken worden gebruikt, zoals selectie van voorwaartse functies en eliminatie van achterwaartse functies.

PCA is geen wondermiddel dat alle problemen met multidimensionale gegevens zal oplossen. Het succes is sterk afhankelijk van de gegevens waarmee u werkt. De statistische variantie komt mogelijk niet overeen met variabelen met de meest voorspellende waarden, ook al is het veilig om met dergelijke benaderingen te werken.

Principale componentenanalyse toepassen op voorspellende analyses - dummies

Bewerkers keuze

Het menu Blender View - dummies

Het menu Blender View - dummies

Af en toe wilt u weten hoe een model eruitziet wanneer het wordt bekeken rechtstreeks vanaf de voorkant, zijkant of bovenkant. Blender heeft een aantal handige snelkoppelingen om snel over te schakelen naar deze weergaven. De meest voor de hand liggende manier is om het menu Beeld in de kop van de 3D-weergave te gebruiken, zoals links in de afbeelding. ...

Test uw mobiele site met DeviceAnywhere - dummies

Test uw mobiele site met DeviceAnywhere - dummies

Een geweldige optie voor het testen van mobiele ontwerpen op een grote verscheidenheid van apparaten die een desktopcomputer gebruiken, geeft DeviceAnywhere u toegang tot meer dan 1, 500 handsets en test ze zoals ze zouden uitvoeren op providers in de Verenigde Staten, Canada, Engeland, Spanje, Duitsland, Frankrijk en Brazilië. De elektronische ingewanden van alle apparaten zijn aangesloten op ...

De add-onsopties in Blender's Gebruikersvoorkeuren - dummies

De add-onsopties in Blender's Gebruikersvoorkeuren - dummies

Blender wordt geleverd met een assortiment van uitbreidingen, add-ons genaamd, die gebruikers aanvullende mogelijkheden bieden binnen Blender. Als je bijvoorbeeld een oudgediende Blenderhead bent en je bent gewend aan het oude Spatiebalkmenu van veel eerdere versies van Blender, is er een add-on die die functie terugzet. Andere add-ons wijzigen de interface van Blender, voegen nieuwe primitieve objecten toe, ...

Bewerkers keuze

Football's Defence Team: The Linebackers - dummies

Football's Defence Team: The Linebackers - dummies

Door het ontwerp van de American football defense, zijn linebackers de leiders van die ploeg van elf man. De rest van de verdediging van een team kijkt op verschillende manieren naar de linebackers: Linebackers zijn de verdedigende quarterbacks en coaches op het veld en beginnen elk spel door de verdedigende call te geven. Ze bepalen de norm voor elke ...

Wat maakt een goede verdedigingslineman in het voetbal - Dummies

Wat maakt een goede verdedigingslineman in het voetbal - Dummies

Grote verdedigende linemen in het Amerikaanse voetbal hebben een combinatie nodig van grootte, snelheid, sterkte en duurzaamheid, die niet bij veel spelers wordt aangetroffen. Een goede verdedigende lineman heeft de meerderheid van deze kwaliteiten: Grootte: een defensieve lijnwachter moet 260 pond of groter zijn. Duurzaamheid: defensieve linemen moeten de bestraffing van een klap kunnen weerstaan ​​...

De positie in een secundaire baan - dummies

De positie in een secundaire baan - dummies

De secundaire is de naam van de spelersgroep op een Amerikaanse voetbalteam dat het verdedigende achterveld vormt. Alle spelers die deel uitmaken van het secundair worden verdedigende ruggen genoemd, maar die categorie is verder verdeeld. In een notendop: deze spelers zijn verantwoordelijk voor het voorkomen dat de ontvangers van de tegenstander de ...

Bewerkers keuze

Digitale SLR camerabesturing op de achterkant - dummy's

Digitale SLR camerabesturing op de achterkant - dummy's

Omdat u met een DSLR-camera zoveel verschillende dingen kunt doen , de leercurve is een beetje steil. Je bent echter een serieuzere fotograaf, dus die opties zijn waarschijnlijk de reden dat je in de eerste plaats een digitale spiegelreflexcamera hebt gekocht, zelfs als je al die bedieningselementen in eerste instantie ontmoedigend vindt. Deze lijst ...

4 Plaatsen om belichtingsinstellingen weer te geven op uw digitale SLR-camera - dummies

4 Plaatsen om belichtingsinstellingen weer te geven op uw digitale SLR-camera - dummies

Behalve dat u oplet voor de algemene belichting, weergegeven op de belichtingsschaal van uw digitale spiegelreflexcamera, moet u de drie belichtingsinstellingen volgen: diafragma, sluitertijd en ISO. Sluitertijd en diafragma zijn vaak gepaard; ISO heeft de neiging om alleen te zijn. Je kunt ze hier vinden:

9 Favoriete low-cost gadgets voor dSLR-fotografie - dummies

9 Favoriete low-cost gadgets voor dSLR-fotografie - dummies

Accessorizing van uw DSLR hoeft niet duur zijn. Hier zijn tien coole gadgets die minder dan $ 100 kosten en die je spek kunnen besparen in tijden van nood. (En wie vindt het niet leuk om af en toe een beetje bacon te waarderen?) Je zou de meeste van deze items in een kleine doos in de kofferbak van mijn auto kunnen bewaren - ...