\(\renewcommand{\vec}[1]{\mathbf{#1}} \DeclareMathOperator*{\sijoitus}{\Big/} \newcommand{\eval}[2]{\sijoitus_{\kern-0.7em#1}^{\kern0.7em#2}\!} \)

6.4 Keskihajonnat

Keskihajonta on eräänlainen mitta tilaston vaihtelulle, eli sille, kuinka lähellä arvot ovat keskimäärin toisiaan.

Keskihajonta saa arvon nolla, jos kaikki arvot ovat samoja.

Ajatellaan esimerkkinä jousiammuntaa. Kun nuolet ovat yhdessä kasassa, on keskihajonta pieni, ja kun nuolet ovat osuneet vähän sinne sun tänne, on hajonta suuri.

Keskihajonnan laskemisessa hyödynnetään arvojen etäisyyksiä keskiarvosta. Etäisyyksien toiset potenssit lasketaan yhteen, jaetaan arvojen lukumäärällä* ja tuloksesta otetaan neliöjuuri. Tuloksen yksikkö on sama kuin arvojen yksikkö.

Matemaattisena kaavana keskihajonta merkitään seuraavasti (perusjoukon keskihajonta, population standard deviation):

\begin{equation*} \sigma =\sqrt{\frac{\sum_{i=1}^{n}(x_i-\overline{x})^2}{n}} \end{equation*}

Kun tutkitaan vain osaa perusjoukosta, vähennetään nimittäjästä yksi (otoskeskihajonta, sample standard deviation):

\begin{equation*} s =\sqrt{\frac{\sum_{i=1}^{n}(x_i-\overline{x})^2}{n-1}} \end{equation*}

Kaavoissa merkintä \(\overline{x}\) on arvojen aritmeettinen keskiarvo, \(x_i \) yksittäinen arvo ja \(n\) arvojen lukumäärä.

Keskihajontaa merkitään kirjaimilla \(σ\) (sigma) ja \(s\) (muitakin tapoja voi tulla vastaan). Useimmiten tarkoitetaan nimenomaan otoskeskihajontaa, jossa tutkitaan vain osaa kohderyhmästä (\(s\)). Jos tutkitaan kuitenkin koko perusjoukkoa, voidaan käyttää merkintää \(σ\). Laskukaavoissa on pieni ero, jolla varsinkaan suuremmilla joukoilla ei ole käytännön merkitystä. Pienillä aineistoilla tulos kuitenkin poikkeaa, joten pitää tietää, kumpaa kaavaa käytetään.

Video aiheesta: http://www.youtube.com/watch?v=L9TLPb9OB-Q (taulukointi Excelillä, 10 min, perusteellinen)

*kun kyseessä on otoskeskihajonta, vähennetään jakajasta yksi. Asian perustelu saadaan tilastotieteen teoriasta, jonka tarkempi käsittely ei ole täällä mielekästä.