Huis Persoonlijke financiën De limieten van beoordelingsgegevens in Machine Learning - dummies

De limieten van beoordelingsgegevens in Machine Learning - dummies

Video: Installing, configuring and running the small Chinese AT1-0750X VFD 2025

Video: Installing, configuring and running the small Chinese AT1-0750X VFD 2025
Anonim

Beoordelingsgegevens hebben beperkingen in het leren van machines. Voor aanbevelingssystemen die goed werken, moeten ze over u weten evenals andere mensen, beide zoals u en verschillend van u. Het verkrijgen van beoordelingsgegevens stelt een aanbevelingssysteem in staat om te leren van de ervaringen van meerdere klanten. Beoordelingsgegevens kunnen afkomstig zijn van een beoordeling (zoals het beoordelen van een product met sterren of cijfers) of een feit (een binaire 1/0 die eenvoudigweg verklaart dat u het product hebt gekocht, een film hebt gezien of bent gestopt met browsen op een bepaalde webpagina).

Ongeacht de gegevensbron of het type, beoordelingsgegevens hebben altijd betrekking op gedrag. Als u een film wilt beoordelen, moet u beslissen deze te bekijken, bekijken en vervolgens beoordelen op basis van uw ervaring met het bekijken van de film.Actueel aanbevelingssystemen leren op verschillende manieren van beoordelingsgegevens:

  • Gezamenlijke filtering: Komt overeen beoordelaars op basis van film- of productovereenkomsten die in het verleden zijn gebruikt. U kunt aanbevelingen krijgen op basis van items wordt leuk gevonden door mensen die op jou lijken of op items die lijken op die je leuk vindt.
  • Filteren op basis van inhoud: gaat verder dan het feit dat je een film hebt bekeken. Het onderzoekt de kenmerken ten opzichte van u en de film om te bepalen of een overeenkomst bestaat op basis van de grotere categorieën die de functies vertegenwoordigen. Als u bijvoorbeeld een vrouw bent die van actiefilms houdt, zoekt de aanbeveler naar suggesties die de kruising van deze twee categorieën omvatten.
  • Kennisaanbevelingen: Gebaseerd op metadata, zoals door gebruikers geuite voorkeuren en productbeschrijvingen. Het is afhankelijk van machine learning en is effectief wanneer u niet over genoeg gegevens over het gedrag beschikt om de gebruikers- of productkenmerken te bepalen. Dit wordt een koude start genoemd en vertegenwoordigt een van de moeilijkste aanbevelerstaken omdat u geen toegang hebt tot filteren op basis van samenwerking of op inhoud gebaseerde filtering.

Wanneer u collaboratieve filtering gebruikt, moet u de overeenkomst berekenen. Afgezien van Euclidean, Manhattan en Chebyshev afstanden, de rest van deze informatie bespreekt cosinus gelijkenis. Cosinus-overeenkomst meet de hoek cosinusafstand tussen twee vectoren, wat een moeilijk concept lijkt om te begrijpen, maar slechts een manier is om hoeken in gegevensruimten te meten.

Stel je een ruimte voor die bestaat uit functies en twee punten heeft. Je kunt de afstand tussen de punten meten. Je kunt bijvoorbeeld de Euclidische afstand gebruiken, wat een perfecte keuze is als je weinig dimensies hebt, maar die jammerlijk faalt als je meerdere dimensies hebt vanwege de vloek van dimensionaliteit.

Het idee achter de cosinusafstand is om in plaats daarvan de hoek te gebruiken die is gecreëerd door de twee punten die zijn verbonden met de oorsprong van de ruimte (het punt waarop alle dimensies nul zijn). Als de punten dichtbij zijn, is de hoek smal, ongeacht hoeveel dimensies er zijn. Als ze ver weg zijn, is de hoek vrij groot.

Cosinus-overeenkomst implementeert de cosinusafstand als een percentage en is vrij effectief om te vertellen of een gebruiker vergelijkbaar is met een andere of dat een film aan een andere kan worden gekoppeld omdat dezelfde gebruikers daar de voorkeur aan geven. In het volgende voorbeeld worden de films gevonden die de meest gelijkende films zijn als film 50, Star Wars.

afdrukken (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- overeenkomsten (MovieLense [50],

MovieLense [-50],

method = "cosine",

which = "items")

colnames (similar_movies) [which (similar_movies> 0. 70)]

[1] "Toy Story (1995)" < "Empire Strikes Back, The (1980)"

[3] "Raiders of the Lost Ark (1981)"

"Return of the Jedi (1983)"

De limieten van beoordelingsgegevens in Machine Learning - dummies

Bewerkers keuze

Beveiligen Bitcoins - dummies

Beveiligen Bitcoins - dummies

Beveiliging is net zo belangrijk voor bitcoin als voor uw persoonlijke bankrekening. Hoe veiliger u toegang tot uw bitcoins maakt, hoe minder kans dat iemand erin slaagt om ze te achterhalen. Wanneer u wordt gevraagd om een ​​wachtwoord op te geven, moet u er bijvoorbeeld voor zorgen dat het uniek is. Gebruik geen wachtwoord dat u gebruikt voor andere ...

Hoe te omzeilen Uw QuarkXPress Layout - dummies

Hoe te omzeilen Uw QuarkXPress Layout - dummies

De twee navigatietechnieken die u het meest gebruikt bij het opmaken pagina's in QuarkXPress zoomen in en uit op een pagina (ook bekend als veranderend beeldpercentage) en pannen rond een pagina. Omdat deze acties zo vaak voorkomen, vindt u gereedschappen daarvoor onderaan het palet Tools. Het gereedschap Zoomen ...

Service Oriented Architecture Components - dummies

Service Oriented Architecture Components - dummies

Alle elementen van Service Oriented Architecture (SOA) zijn geschikt om verbinding te maken door bedrijfsprocessen om een ​​nauwkeurig serviceniveau te leveren. SOA ontwikkelt een basisarrangement van componenten die gezamenlijk een ingewikkelde zakelijke service kunnen beheren. Om de lay-out van SOA te begrijpen, neemt u een kijkje in dit stroomdiagram van servicegeoriënteerde architectuurcomponenten: Om te helpen ...

Bewerkers keuze

Boek Openbaring: gebeurtenissen rondom de apostel Johannes's geschriften - dummies

Boek Openbaring: gebeurtenissen rondom de apostel Johannes's geschriften - dummies

John, die de bijbel schreef Openbaring, was de langst levende apostel; als zodanig was hij getuige van buitengewone veranderingen in de politieke, sociale, religieuze en economische wereld. De volgende historische gebeurtenissen waren belangrijk voor Johannes de Apostel en zijn toehoorders: Eerste uitbarsting van vervolging van christenen door Nero (64 GT) Paulus en Petrus zijn gemarteld ...

Data die van invloed waren op de vorming van het christelijke oude testament - dummies

Data die van invloed waren op de vorming van het christelijke oude testament - dummies

In de laatste twee eeuwen vóór Jezus, Joodse geschriften die in het Grieks werden vertaald (inclusief Griekse vertalingen van de oudere Hebreeuwse werken die niet in de Hebreeuwse Bijbel voorkomen) begonnen samen te komen om de christelijke Bijbel te vormen, meer specifiek het Oude Testament. Deze data zijn belangrijk voor de ontwikkeling van het Oude Testament: 30-33 CE: Jezus citeert ...

Bewerkers keuze

Flash CS5-codefragmenten en instantienaam - dummies

Flash CS5-codefragmenten en instantienaam - dummies

De toevoeging van het nieuwe deelvenster Flash CS5-codefragmenten aan Adobe Flash Creative Suite 5 brengt ActionScript voor veel meer gebruikers binnen handbereik en biedt voor de meest voorkomende behoeften vooraf afgewerkte codefragmenten. Het deelvenster Codefragmenten is een handige manier om aan de slag te gaan, maar wanneer u klaar bent om op pad te gaan ...

Lijnen en curven tekenen in Flash CS5 - dummies

Lijnen en curven tekenen in Flash CS5 - dummies

De pen- en potloodhulpmiddelen in Adobe Flash Creative Suite 5 helpen je maakt complexere kunstwerken dan die aangeboden door de Vorm- en Lijngereedschappen. Teken eenvoudige lijnen met het lijngereedschap Het lijngereedschap maakt het maken van perfecte, rechte lijnen snel en gemakkelijk. Als u een rechte lijn wilt maken, kiest u het gereedschap Lijn van ...

In op Fine-Tune Flash CS5 Shape Tweens met Shape Hinting - dummies

In op Fine-Tune Flash CS5 Shape Tweens met Shape Hinting - dummies

Soms Adobe Flash Creative Suite 5 kan dingen overdenken en meer vormveranderingen uitvoeren dan het moet doen, vooral wanneer twee vormen gemeenschappelijke kenmerken hebben. In deze gevallen kunt u vormhints gebruiken - sets van gematchte markeringen die Flash CS5 kunnen vertellen dat twee punten op twee verschillende vormen gerelateerd zijn. U kunt een bijlage toevoegen ...