[#] Sisällön pääryhmät --> Todennäköisyys --> Tilastomatematiikka [ 1 2 3 4 5 6 7 8 ]
ESITIEDOT:
KATSO MYÖS: [#] todennäköisyyslaskenta, [#] todennäköisyysjakaumat, [#] keskiarvo
[#] Kansisivu
[#] Sisältö
[#] Hakemisto


Tilastodata

Tilastojen pohjana on jollakin johdonmukaisella tavalla kerätty jotakin ilmiötä koskeva data (tiedot). Esimerkkejä ovat tuhannelta hengeltä kysytty poliittinen puoluekanta, koululuokan matematiikan kokeen arvosanat ja joukko-osaston alokkaiden pituudet.

Data voi olla diskreettiä, jolloin vain tietyt arvot tulevat kysymykseen (puoluekanta, arvosanat), tai jatkuvaa, jolloin periaatteessa mikä tahansa jollakin välillä oleva reaaliarvo on mahdollinen (ihmisten pituudet). Data voi olla numeerista (arvosanat, pituudet) tai nominaalista (puolueiden nimet). Jälkimmäisessä tapauksessa se voidaan koodata numeeriseen muotoon, mutta koodaus ei (välttämättä) merkitse järjestyksen muodostamista: vaikka puolueille annettaisiinkin numerot, nämä tuskin kuvaavat puolueiden sijoittumista vaikkapa oikeisto-vasemmisto -akselille.

Diskreetin datan tapauksessa voidaan jokaiselle data-arvolle laskea sen frekvenssi: montako kertaa arvo esiintyy datassa. Jatkuva data voidaan ensin luokitella (esimerkiksi sijoittaa ihmisten pituuksien arvot viiden senttimetrin pituisille väleille) ja tämän jälkeen muodostaa luokkien frekvenssit.

Frekvenssit voidaan esittää havainnollisessa muodossa erilaisina diagrammeina. Tavallisimpia ovat pylväsdiagrammit eli histogrammit, joissa esitetään yleensä absoluuttiset frekvenssit, ja piirakkadiagrammit, joista ilmenevät frekvenssien suhteelliset osuudet kokonaisuudesta.

Jos data esittää ilmiön kehitystä ajan mukana, ts. kyseessä on aikasarja, voidaan ilmiötä kuvata ajan funktiona. Argumenttina vaaka-akselilla on tällöin aika.

Esimerkkejä seuraavassa.

  [#] funktio

Kivelä, M niinkuin matematiikka, versio 1.12