\(\renewcommand{\vec}[1]{\mathbf{#1}} \DeclareMathOperator*{\sijoitus}{\Big/} \newcommand{\eval}[2]{\sijoitus_{\kern-0.7em#1}^{\kern0.7em#2}\!} \)

Tilastot

Kuva 1
Tilasto on havaintoja numeromuodossa yleensä taulukossa tai graafisesti esitettynä, kuten esimerkiksi kuvassa 1.

Alla on lyhyesti esitelty muutamia yleisiä käsitteitä.

Perusjoukko
Koko tutkittava joukko. Jos tutkitaan oravien ruokailutaipumuksia Suomessa, on perusjoukko kaikki Suomen oravat.

Otos
Jollakin järkevällä tavalla (otantamenetelmä) valittu osa perusjoukosta. Tarkoitus on, että otos edustaa mahdollisimman hyvin koko perusjoukkoa. Usein perusjoukkoa on mahdotonta tutkia kokonaisuudessaan, joten on tyydyttävä otoksen tutkimiseen. Kun otos on hyvin valittu, voidaan tulokset usein yleistää koskemaan koko perusjoukkoa.

Havaintoaineisto
Tutkimuksen toimintavaiheessa tehdään havaintoja otoksesta tai perusjoukosta. Havainnot muodostavat havaintoaineiston, jota sitten analysoidaan ja tulkitaan.

Muuttuja
Tilastollinen muuttuja on jokin tutkittavan kohteen ominaisuus. Tutkimuksessa voidaan tarkastella yhtä tai useampaa muuttujaa. Muuttuja on jatkuva, jos se voi saada mitä tahansa lukuarvoja ja diskreetti, jos mahdollisia arvoja on rajoitettu määrä. Esimerkiksi pituus on jatkuva muuttuja ja lasten lukumäärä diskreetti.

Frekvenssi \(f\)
Kertoo sen, kuinka monta kertaa tietty arvo ilmenee havaintoaineistossa (absoluuttinen frekvenssi). Jos tulos jaetaan kaikkien havaintojen määrällä, saadaan suhteellinen frekvenssi (ilmoitetaan yleensä prosenttilukuna).

Kun frekvenssejä lasketaan yhteen, saadaan summafrekvenssi \(s\!f\), joka voidaan myös ilmoittaa prosentteina (suhteellinen summafrekvenssi). Kuvassa 2 on esimerkki pienestä kuvitteellisesta joulukuusitutkimuksesta, josta muodostettu kuvaaja on kuvassa 1.

Luokkakeskus on luokan todellisen alarajan ja todellisen ylärajan keskiarvo. Esimerkiksi luokan 101−150 todellinen alaraja on 100,5 cm ja todellinen yläraja 150,5 cm (pyöristysrajojen mukaan).

Kuva 2: Frekvenssitaulukko