\(\renewcommand{\vec}[1]{\mathbf{#1}} \DeclareMathOperator*{\sijoitus}{\Big/} \newcommand{\eval}[2]{\sijoitus_{\kern-0.7em#1}^{\kern0.7em#2}\!} \)

Luokittelu

Jos tilasto koostuu lukuarvoista ja niitä on paljon erilaisia, on ne usein kätevä jakaa luokkiin (väleihin). Luokista on helpompi sitten vaikkapa tehdä diagrammeja.

Luokittelusta halutaan usein tasavälinen, jolloin jokaisen välin pitää olla yhtä pitkä. Välit eivät saa mennä päällekkäin, joten edellinen väli ei voi loppua samaan lukuun kuin millä seuraava alkaa.

Pari vinkkiä luokittelun avuksi:

  • Etsi tilaston pienin ja suurin arvo ja jaa niiden erotus välien lukumäärällä. Näin saat yleensä hyvän ehdotuksen välin pituudelle. Pyöristä alaspäin, ellei mene tasan.
  • Ensimmäinen väli voi hyvin alkaa vähän pienimmän arvon alapuolelta ja viimeinen jatkua suurimman arvon yli. Huolehdi kuitenkin siitä, että sekä ensimmäisessä että viimeisessä välissä on vähintään yksi arvo. Ellei näin ole, pienennä välin pituutta tai lähennä välien päätepisteitä.

Esimerkki: jako viiteen tasaväliseen luokkaan
Kasa halkoja mitattiin ja saatiin seuraavat pituudet (suuruusjärjestyksessä ja senttimetreinä):

23, 24, 29, 34, 36, 37, 37, 38, 39, 40, 40, 41, 41, 43, 43, 44, 44, 45, 45, 45, 47, 47, 49, 49, 51

Pienimmän ja suurimman erotus on 51-23 = 28. Tämä jaettuna viidellä on 5,6. Valitaan välin pituudeksi mukava tasaluku 5, koska luokkien väliin jää aina vähän tilaa, joka "venyttää" jakoa. Merkitään välit ja niitä vastaavat frekvenssit (esiintymislukumäärät) taulukkoon:

Pituusväli (cm)Halkojen lkm (frekvenssi)
22−272
28−331
34−396
40−4511
46−515

Huomaa, että ensimmäinen väli alkaa vähän pienintä arvoa alempaa. Aloituspisteen paikkaa ei ole tarkasti määrätty, kunhan se on korkeintaan yhtä suuri kuin pienin arvo. Samoin viimeinen väli voi mennä jonkin verran suurimman arvon yli, kunhan ei mennä ylettömyyksiin.