Slik beregner du gjenværende variasjon

Innholdsfortegnelse:

Anonim

Investorer bruker modeller for bevegelse av eiendomspriser for å forutsi hvor prisen på en investering vil være til enhver tid. Metodene som brukes til å gjøre disse spådommene, er en del av et felt i statistikk kjent som regresjonsanalyse. Beregningen av restvariasjon av et sett med verdier er et regresjonsanalyseværktøy som måler hvor nøyaktig modellens prediksjoner samsvarer med faktiske verdier.

Regresjonslinje

De regresjonslinje viser hvordan aktivets verdi har endret seg på grunn av endringer i ulike variabler. Også kjent som a trendlinje, viser regresjonslinjen "trend" av aktivets pris. Regresjonslinjen er representert ved en lineær ligning:

Y = a + bX

hvor "Y" er eiendelverdien, "a" er en konstant, "b" er en multiplikator og "X" er en variabel knyttet til aktivverdien.

For eksempel, hvis modellen forutsier at et ett-roms hus selger for $ 300 000, selger et to-roms hus for $ 400 000, og et tre-roms hus selger for $ 500 000, vil regresjonslinjen se ut som:

Y = 200.000 + 100.000X

hvor "Y" er hjemmens salgspris og "X" er antall soverom.

Y = 200.000 + 100.000 (1) = 300.000

Y = 200 000 + 100 000 (2) = 400 000

Y = 200.000 + 100.000 (3) = 500.000

scatterplot

EN scatterplot viser poengene som representerer de faktiske korrelasjonene mellom aktivverdien og variabelen. Begrepet "scatterplot" kommer fra det faktum at når disse punktene er tegnet på en graf, ser de ut til å være "spredt" rundt, i stedet for å ligge perfekt på regresjonslinjen. Ved hjelp av eksemplet ovenfor kan vi få en scatterplot med disse datapunktene:

Punkt 1: 1BR solgt for 288.000 dollar

Punkt 2: 1BR solgt for $ 315,000

Punkt 3: 2BR solgt for $ 395,000

Punkt 4: 2BR solgt for $ 410.000

Punkt 5: 3BR solgt for $ 492,000

Punkt 6: 3BR solgt for $ 507,000

Restvariantberegning

Den resterende variansberegningen starter med summen av firkanter av forskjeller mellom verdien av aktiva på regresjonslinjen og hver tilsvarende aktivverdi på scatterplot.

Firkantene av forskjellene er vist her:

Punkt 1: $ 288 000 - $ 300 000 = (- $ 12 000); (-12,000)2 = 144,000,000

Punkt 2: $ 315,000 - $ 300,000 = (+ $ 15,000); (15000)2 = 225,000,000

Punkt 3: $ 395 000 - $ 400 000 = (- $ 5000); (-5000)2 = 25,000,000

Punkt 4: $ 410 000 - $ 400 000 = (+ $ 10 000); (10000)2 = 100,000,000

Punkt 5: $ 492 000 - $ 500 000 = (- $ 8 000); (-8000)2 = 64,000,000

Punkt 6: $ 507 000 - $ 500 000 = (+ $ 7 000); (7000)2 = 49,000,000

Summen av torgene = 607,000,000

Den resterende variansen er funnet ved å ta summen av rutene og dele den med (n-2), hvor "n" er antall datapunkter på scatterplot.

RV = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000.

Bruker for gjenværende variasjon

Mens hvert punkt på scatterplot ikke passer perfekt med regresjonslinjen, vil en stabil modell ha scatterplot-punktene i en jevn fordeling rundt regresjonslinjen. Residual varians er også kjent som "feil varians." En høy gjenværende varians viser at regresjonslinjen i den opprinnelige modellen kan være feil. Noen regnearkfunksjoner kan vise prosessen bak å opprette en regresjonslinje som passer nærmere med scatterplot-dataene.