En av de mest grunnleggende begreper i statistikk er gjennomsnittet eller aritmetisk gjennomsnitt, av et sett med tall. Middelet betyr en sentral verdi for datasettet. De varians av et datasett måler hvor langt elementene i datasettet er spredt ut fra gjennomsnittet. Datasett hvor tallene er alle nær gjennomsnittet, vil ha lav varians. De settene hvor tallene er mye høyere eller lavere enn gjennomsnittet, vil ha en høy varians.
Beregn gjennomsnitt av datasettet
Beregn kvadratiske forskjeller
Det neste trinnet innebærer å beregne forskjellen mellom hvert element i datasettet og gjennomsnittet. Siden noen elementer vil være høyere enn gjennomsnittet og noen vil være lavere, bruker variansberegningen kvadratet av forskjellene.
Dag 1 Salg - Gjennomsnittlig salg: $ 62,000 - $ 65414,29 = (- $ 3,414,29); (-3,414.29)2 = 11,657,346.94
Dag 2 Salg - Gjennomsnittlig salg: $ 64 800 - $ 65414.29 = (- $ 614.29); (-614,29)2 = 377,346.94
Dag 3 Salg - Gjennomsnittlig salg: $ 62,600 - $ 65414,29 = (- $ 2,814,29); (-2,814.29)2 = 7,920,204.08
Dag 4 Salg - Gjennomsnittlig salg: $ 69,200 - $ 65414,29 = (+ $ 3,785,71); (+3,785.71)2 = 14,331,632.65
Dag 5 Salg - Gjennomsnittlig salg: $ 66,000 - $ 65414.29 = (+ $ 585.71); (585,71)2 = 343,061.22
Dag 6 Salg - Gjennomsnittlig salg: $ 63,900 - $ 65414,29 = (- $ 1,514,29); (-1,514.29)2 = 2,293,061.22
Dag 7 Salg - Gjennomsnittlig salg: $ 69,400 - $ 65414,29 = (+ $ 3,985.71); (+3,985.71)2 = 15,885,918.37
MERK: De kvadratiske forskjellene er ikke målt i dollar. Disse tallene brukes i neste trinn for å beregne variansen.
Varians og standardavvik
Variansen er definert som gjennomsnittet av de kvadratiske forskjellene.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
Siden variansen bruker kvadratet av forskjellen, vil kvadratroten av variansen gi en klarere indikasjon på den faktiske spredningen. I statistikk kalles kvadratroten av variansen standardavvik.
SQRT (7,544,081,63) = $ 2,746,65
Bruker for variasjon og standardavvik
Både varians og standardavvik er svært nyttige i statistisk analyse. Variansen måler det samlede spredningen av et datasett fra gjennomsnittet. Standardavviket hjelper med å oppdage uteliggere, eller elementer av datasettet som kjører for langt fra gjennomsnittet.
I datasettet ovenfor er variansen ganske høy, med bare to daglige salgstall som kommer til innenfor $ 1000 av gjennomsnittet. Datasettet viser også at to av de syv daglige salgstallene er mer enn ett standardavvik over gjennomsnittet, mens to andre er mer enn ett standardavvik under gjennomsnittet.