Video: Webcursus excel - cursus deel 19 - Trendlijnen en prognoses 2024
Lineaire regressie is een statistische methode die relaties tussen twee variabelen analyseert en vindt. In voorspellende analyses kan het worden gebruikt om een toekomstige numerieke waarde van een variabele te voorspellen.
Beschouw een voorbeeld van gegevens die twee variabelen bevatten: gegevens uit het verleden die bestaan uit de aankomsttijden van een trein en de bijbehorende vertragingstijd. Stel dat je wilt voorspellen wat de vertraging is voor de volgende trein. Als u lineaire regressie toepast op deze twee variabelen - de aankomst- en vertragingstijden - kunt u een lineaire vergelijking genereren, zoals
Delay = a + (b * Arrival time) + d
Deze vergelijking geeft de relatie weer tussen de vertragingstijd en de aankomsttijd. De constanten a en b zijn de parameters van het model. De variabele d is de foutterm (ook bekend als de rest ) - een numerieke waarde die de niet-overeenstemming aangeeft tussen de twee variabelen vertraging > en aankomsttijd . Als de fout niet gelijk is aan nul, kan dat erop wijzen dat er criteria zijn die van invloed zijn op de variabele vertraging .
a, b, en d . Lineaire regressie is (zoals u zich misschien kan voorstellen) het meest geschikt voor lineaire gegevens. Maar het is erg gevoelig voor uitbijters in de gegevenspunten. De uitschieters in uw gegevens kunnen van grote invloed zijn op het model. Het wordt aanbevolen dat u die uitbijters uit de trainingsset verwijdert als u van plan bent om lineaire regressie voor uw voorspellende model te gebruiken.