Nejčastěji obor kromě profesionálních statistiků využívají sociologové, psychologové, odborníci z humanitních studií a prakticky veškeří přírodovědci; máte tedy vysokou šanci, že i vás se statistika někdy bude týkat, až bude potřeba analyzovat nějaký psychologický dotazník, výsledky chemických pokusů či jiná data. V následující sérii článků vám stručně představíme úplné základy, které vám pomohou se ve statistice lépe zpočátku zorientovat a později snad i snáze pochopit hlubší problematiku.
Můžeme využít jednak popisnou statistiku, tedy zaměřit se vždy na jednu proměnnou a popsat její charakteristiky (např. průměr, modus, medián, rozptyl), jednak statistické metody analyzující vztahy mezi více proměnnými. Již dvakrát tu padlo zásadní slovo proměnná – to, jakého typu je, ovlivní naši práci s ní. Ze všeho nejdříve si tedy potřebujeme jednotlivé typy proměnných představit.
Jaký typ proměnné mám ve svém souboru dat?
Klasicky se proměnné dělí do čtyř skupin: na nominální (z nichž se někdy zvlášť vyčleňují binární), ordinální, intervalové a poměrové.
Nominální
Jedná se o proměnnou se slovními kategoriemi (popř. popsanými číselným kódem), které popisují všechny možnosti. Může to být například město narození, národnost či povolání. Zvláštní případ nastává, když existují pouze dvě možnosti – taková proměnná se pak někdy vyčleňuje jako binární a příkladem je třeba pohlaví (ať už ho označíme muž/žena, M/Z, 0/1 či jinak).
Ordinální
Jde o proměnné podobné nominálním, s tím rozdílem, že jsou uspořádané – existuje tam jasné pořadí. Příkladem je dosažená úroveň vzdělání, kde můžeme postupovat od žádného po základní, střední, střední s maturitou a vysokoškolské.
Intervalové
Zde se již setkáváme s proměnnými vyjádřenými spojitými číselnými hodnotami – to znamená, že v rozdělení nejsou žádné mezery, neexistují oddělení kategorie např. dvaceti a jednadvaceti stupňů Celsia; teoreticky můžeme teplotu měřit přesně až „donekonečna“, jednotlivé hodnoty na sebe navazují. V praxi samozřejmě uvádíme hodnoty na předem dohodnutý počet desetinných míst, většinou jedno až tři. U intervalových proměnných se ptáme na rozdíl hodnot – na to, o kolik stupňů vyšší je teplota v Praze oproti Kvildě apod.
Poměrové
I poměrové proměnné jsou číselné a spojité. Rozdílem oproti intervalovým je skutečnost, že u poměrových má smysl se ptát nejen na rozdíl, ale i podíl hodnot. Typickým příkladem je výška – více než to, že jsou třeba Evropané v průměru o několik centimetrů vyšší než Asiaté, nám řekne sdělení, o kolik procent jsou vyšší. Dělení na poměrové a intervalové proměnné není absolutní; mohli bychom se také ptát, o kolik procent tepleji než na Kvildě je v Praze, ale není to zvykem, u teplot jsme zvyklí pouze na popisování rozdílu a s ním počítáme; u výšky či hmotnosti často používáme i podíl (běžně vyjádřený v procentech).
Nyní jsme si vysvětlili základní typy statistických proměnných; v příští části série článků se dozvíte, jakou popisnou statistiku můžeme u jednotlivých typů použít a jak přehledně popíšeme vlastnosti našeho souboru dat – například výšku změřené populace, vzdělání skupiny lidí, meteorologické záznamy či původ studentů jedné školy z různých měst.