\(\renewcommand{\vec}[1]{\mathbf{#1}} \DeclareMathOperator*{\sijoitus}{\Big/} \newcommand{\eval}[2]{\sijoitus_{\kern-0.7em#1}^{\kern0.7em#2}\!} \)

Kahden muuttujan tilastot

Kaksi tilastollista muuttujaa voivat olla yhteydessä toisiinsa. Esimerkiksi liikenteen määrä ja tien kuluminen ovat luultavasti syy-seuraus-yhteydessä keskenään. Tällöin on tärkeää hahmottaa, kumpi muuttuja on syy (selittävä) ja kumpi seuraus (selitettävä). Tässä liikenteen määrä on mitä todennäköisimmin syy ja tien kuluminen seuraus. Kuulostaisi erikoiselta sanoa, että tien kuluminen aiheuttaa liikennettä, jollei sitten ajatella nimenomaan tietyöajoneuvoja tien korjausta varten.

Kahden muuttujan välinen yhteys voi olla lineaarista, tai esimerkiksi eksponentiaalista tai logaritmista. Aineiston perusteella pyritään selvittämään muuttujien mahdolliset riippuvuudet ja kehittämään työkaluja ennustamiselle.

Kahden muuttujan aineisto voidaan piirtää koordinaatistoon. Usein pyritään löytämään matemaattinen funktio, jonka kuvaaja sopii mahdollisimman hyvin pistejoukkoon. Korrelaatiokerroin kuvaa sitä, miten hyvin pisteet ja kuvaaja sopivat yhteen.