Huis Persoonlijke financiën De limieten van beoordelingsgegevens in Machine Learning - dummies

De limieten van beoordelingsgegevens in Machine Learning - dummies

Video: Installing, configuring and running the small Chinese AT1-0750X VFD 2025

Video: Installing, configuring and running the small Chinese AT1-0750X VFD 2025
Anonim

Beoordelingsgegevens hebben beperkingen in het leren van machines. Voor aanbevelingssystemen die goed werken, moeten ze over u weten evenals andere mensen, beide zoals u en verschillend van u. Het verkrijgen van beoordelingsgegevens stelt een aanbevelingssysteem in staat om te leren van de ervaringen van meerdere klanten. Beoordelingsgegevens kunnen afkomstig zijn van een beoordeling (zoals het beoordelen van een product met sterren of cijfers) of een feit (een binaire 1/0 die eenvoudigweg verklaart dat u het product hebt gekocht, een film hebt gezien of bent gestopt met browsen op een bepaalde webpagina).

Ongeacht de gegevensbron of het type, beoordelingsgegevens hebben altijd betrekking op gedrag. Als u een film wilt beoordelen, moet u beslissen deze te bekijken, bekijken en vervolgens beoordelen op basis van uw ervaring met het bekijken van de film.Actueel aanbevelingssystemen leren op verschillende manieren van beoordelingsgegevens:

  • Gezamenlijke filtering: Komt overeen beoordelaars op basis van film- of productovereenkomsten die in het verleden zijn gebruikt. U kunt aanbevelingen krijgen op basis van items wordt leuk gevonden door mensen die op jou lijken of op items die lijken op die je leuk vindt.
  • Filteren op basis van inhoud: gaat verder dan het feit dat je een film hebt bekeken. Het onderzoekt de kenmerken ten opzichte van u en de film om te bepalen of een overeenkomst bestaat op basis van de grotere categorieën die de functies vertegenwoordigen. Als u bijvoorbeeld een vrouw bent die van actiefilms houdt, zoekt de aanbeveler naar suggesties die de kruising van deze twee categorieën omvatten.
  • Kennisaanbevelingen: Gebaseerd op metadata, zoals door gebruikers geuite voorkeuren en productbeschrijvingen. Het is afhankelijk van machine learning en is effectief wanneer u niet over genoeg gegevens over het gedrag beschikt om de gebruikers- of productkenmerken te bepalen. Dit wordt een koude start genoemd en vertegenwoordigt een van de moeilijkste aanbevelerstaken omdat u geen toegang hebt tot filteren op basis van samenwerking of op inhoud gebaseerde filtering.

Wanneer u collaboratieve filtering gebruikt, moet u de overeenkomst berekenen. Afgezien van Euclidean, Manhattan en Chebyshev afstanden, de rest van deze informatie bespreekt cosinus gelijkenis. Cosinus-overeenkomst meet de hoek cosinusafstand tussen twee vectoren, wat een moeilijk concept lijkt om te begrijpen, maar slechts een manier is om hoeken in gegevensruimten te meten.

Stel je een ruimte voor die bestaat uit functies en twee punten heeft. Je kunt de afstand tussen de punten meten. Je kunt bijvoorbeeld de Euclidische afstand gebruiken, wat een perfecte keuze is als je weinig dimensies hebt, maar die jammerlijk faalt als je meerdere dimensies hebt vanwege de vloek van dimensionaliteit.

Het idee achter de cosinusafstand is om in plaats daarvan de hoek te gebruiken die is gecreëerd door de twee punten die zijn verbonden met de oorsprong van de ruimte (het punt waarop alle dimensies nul zijn). Als de punten dichtbij zijn, is de hoek smal, ongeacht hoeveel dimensies er zijn. Als ze ver weg zijn, is de hoek vrij groot.

Cosinus-overeenkomst implementeert de cosinusafstand als een percentage en is vrij effectief om te vertellen of een gebruiker vergelijkbaar is met een andere of dat een film aan een andere kan worden gekoppeld omdat dezelfde gebruikers daar de voorkeur aan geven. In het volgende voorbeeld worden de films gevonden die de meest gelijkende films zijn als film 50, Star Wars.

afdrukken (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- overeenkomsten (MovieLense [50],

MovieLense [-50],

method = "cosine",

which = "items")

colnames (similar_movies) [which (similar_movies> 0. 70)]

[1] "Toy Story (1995)" < "Empire Strikes Back, The (1980)"

[3] "Raiders of the Lost Ark (1981)"

"Return of the Jedi (1983)"

De limieten van beoordelingsgegevens in Machine Learning - dummies

Bewerkers keuze

Een Checklist voor een marathon maken - dummies

Een Checklist voor een marathon maken - dummies

Zoals een coach altijd zei: als u niet van plan bent, bent u van plan om mislukken. Plan een succesvolle marathon uit met deze checklist met dingen die je niet wilt vergeten op de marathonrace-dag: eet een klein ontbijt met 300 tot 400 calorieën koolhydraten en eiwitten 1. 5 tot 2 uur voor de start. ...

Tijden voor hardlooptraining voor marathontraining interpreteren - dummies

Tijden voor hardlooptraining voor marathontraining interpreteren - dummies

Wanneer u traint voor een marathon, duurt het een hele tijd nieuwe dimensie - en woordenschat. Van mijl splitsen (de tijd die je loopt voor elke mijl van een marathon) tot finishtijden (je totale tijd voor een race) tot de snelheid weergegeven op je loopband, marathonlopers worden geconfronteerd met allerlei getallen. Lees verder ...

Rugby Union For Dummies Cheat Sheet (Australië / Nieuw-Zeeland editie) - dummies

Rugby Union For Dummies Cheat Sheet (Australië / Nieuw-Zeeland editie) - dummies

Australië en Nieuw-Zeeland zijn dol op rugby, en de hype voor elke Rugby World Cup - en elke toevoeging van een ander Super Rugby-team - bevordert de invloed van het spel. Maar rugby kijken kan een beetje verwarrend zijn als je de regels niet kent, of wie de hoofdteams zijn. Hier zijn enkele ...

Bewerkers keuze

Bouw de Airbnb-startpagina om Oefen Bootstrap - dummies

Bouw de Airbnb-startpagina om Oefen Bootstrap - dummies

Oefen Bootstrap online met behulp van de Codecademy-website. Codecademy is een gratis website die in 2011 is gemaakt om iedereen in staat te stellen te coderen in de browser, zonder software te installeren of downloaden. Oefen tags door deze stappen te volgen: Ga naar de Dummies. com Codeer de All-in-One pagina en klik op de link naar Codecademy. Als je ...

Bouwen van mobiele webapps - dummies

Bouwen van mobiele webapps - dummies

Hoewel elke website kan worden bekeken met een mobiele browser, zijn die websites niet geoptimaliseerd voor mobiele apparaten zien er een beetje raar uit, alsof de reguliere lettertypegrootte en afmetingen van de website zijn afgenomen om op een mobiel scherm te passen. Daarentegen hebben websites die zijn geoptimaliseerd voor mobiele apparaten lettertypen die leesbaar zijn, afbeeldingen die schalen naar ...

Wie kan een gegevensmijn zijn? - dummies

Wie kan een gegevensmijn zijn? - dummies

Als u enkele nieuwsberichten over datamining hebt gelezen, heeft u misschien de indruk gekregen dat het complexer is dan hersenoperaties. Dat is het niet. Je hebt misschien gehoord dat gegevensmijnwerkers dingen over je kunnen leren die je zelf niet eens kent. Dat is onwaarschijnlijk. Je hebt misschien gehoord dat je een Ph.D. en ...

Bewerkers keuze

10 Coole manieren om Twitter te gebruiken gebruiken - dummies

10 Coole manieren om Twitter te gebruiken gebruiken - dummies

Je kunt Twitter gebruiken voor veel meer dan je vrienden bijhouden en familie. Of je het nu gebruikt om op de hoogte te blijven van je branche, nieuws of tidbits van je favoriete shows en beroemdheden, Twitter heeft veel coole en diverse toepassingen. De mogelijkheden zijn eindeloos. Socialiseren en netwerken De meest geëngageerde mensen op ...

10 Tweets te verzenden naar Vandaag verzenden - dummies

10 Tweets te verzenden naar Vandaag verzenden - dummies

Aan de slag met alles wat nieuw is, is moeilijk. Twitter kan lastig of mysterieus lijken, simpelweg omdat je niet precies weet hoe je eraan moet beginnen om aan de slag te gaan. Hier zijn tien elementaire tweets die u nu kunt verzenden om op de been te blijven. Zeg hallo Je kunt het nu proberen, als je wilt. Gewoon ...

10 Bronnen voor Twitter Glory - dummies

10 Bronnen voor Twitter Glory - dummies

De meeste gebruikers weten hoe ze de Twitter-interface moeten instellen en navigeren, verbindingen kunnen leggen , tweet interessante inhoud, gebruik de nieuwste snelkoppelingen en promoot zelfs uw bedrijf of oorzaak. Dat zou je een pro moeten maken, toch? Welnu, het punt is dat Twitter voortdurend aan het veranderen is om zich aan te passen aan zijn snelle, technologie-liefhebbende gebruikers. Hier zijn de top tien ...