Investorer bruker modeller for bevegelse av eiendomspriser for å forutsi hvor prisen på en investering vil være til enhver tid. Metodene som brukes til å gjøre disse spådommene, er en del av et felt i statistikk kjent som regresjonsanalyse. Beregningen av restvariasjon av et sett med verdier er et regresjonsanalyseværktøy som måler hvor nøyaktig modellens prediksjoner samsvarer med faktiske verdier.
Regresjonslinje
De regresjonslinje viser hvordan aktivets verdi har endret seg på grunn av endringer i ulike variabler. Også kjent som a trendlinje, viser regresjonslinjen "trend" av aktivets pris. Regresjonslinjen er representert ved en lineær ligning:
Y = a + bX
hvor "Y" er eiendelverdien, "a" er en konstant, "b" er en multiplikator og "X" er en variabel knyttet til aktivverdien.
For eksempel, hvis modellen forutsier at et ett-roms hus selger for $ 300 000, selger et to-roms hus for $ 400 000, og et tre-roms hus selger for $ 500 000, vil regresjonslinjen se ut som:
Y = 200.000 + 100.000X
hvor "Y" er hjemmens salgspris og "X" er antall soverom.
Y = 200.000 + 100.000 (1) = 300.000
Y = 200 000 + 100 000 (2) = 400 000
Y = 200.000 + 100.000 (3) = 500.000
scatterplot
EN scatterplot viser poengene som representerer de faktiske korrelasjonene mellom aktivverdien og variabelen. Begrepet "scatterplot" kommer fra det faktum at når disse punktene er tegnet på en graf, ser de ut til å være "spredt" rundt, i stedet for å ligge perfekt på regresjonslinjen. Ved hjelp av eksemplet ovenfor kan vi få en scatterplot med disse datapunktene:
Punkt 1: 1BR solgt for 288.000 dollar
Punkt 2: 1BR solgt for $ 315,000
Punkt 3: 2BR solgt for $ 395,000
Punkt 4: 2BR solgt for $ 410.000
Punkt 5: 3BR solgt for $ 492,000
Punkt 6: 3BR solgt for $ 507,000
Restvariantberegning
Den resterende variansberegningen starter med summen av firkanter av forskjeller mellom verdien av aktiva på regresjonslinjen og hver tilsvarende aktivverdi på scatterplot.
Firkantene av forskjellene er vist her:
Punkt 1: $ 288 000 - $ 300 000 = (- $ 12 000); (-12,000)2 = 144,000,000
Punkt 2: $ 315,000 - $ 300,000 = (+ $ 15,000); (15000)2 = 225,000,000
Punkt 3: $ 395 000 - $ 400 000 = (- $ 5000); (-5000)2 = 25,000,000
Punkt 4: $ 410 000 - $ 400 000 = (+ $ 10 000); (10000)2 = 100,000,000
Punkt 5: $ 492 000 - $ 500 000 = (- $ 8 000); (-8000)2 = 64,000,000
Punkt 6: $ 507 000 - $ 500 000 = (+ $ 7 000); (7000)2 = 49,000,000
Summen av torgene = 607,000,000
Den resterende variansen er funnet ved å ta summen av rutene og dele den med (n-2), hvor "n" er antall datapunkter på scatterplot.
RV = 607,000,000 / (6-2) = 607,000,000 / 4 = 151,750,000.
Bruker for gjenværende variasjon
Mens hvert punkt på scatterplot ikke passer perfekt med regresjonslinjen, vil en stabil modell ha scatterplot-punktene i en jevn fordeling rundt regresjonslinjen. Residual varians er også kjent som "feil varians." En høy gjenværende varians viser at regresjonslinjen i den opprinnelige modellen kan være feil. Noen regnearkfunksjoner kan vise prosessen bak å opprette en regresjonslinje som passer nærmere med scatterplot-dataene.