Naučte se používat statistiku: Proč ji při studiu potřebujeme a jak začít

19.04.2012 | , Studentskefinance.cz
STUDENT - NEPOUŽÍVAT


Statistika je dobrý sluha, ale zlý pán – a pokud je použita nesprávně, mohou být její výsledky zcela nepoužitelné a neúmyslně či záměrně zkreslené. Většina z nás ji bude při studiu alespoň trochu potřebovat, přesto se málokde povinně vyučuje. Jak kvůli využití statistických postupů ve vlastní závěrečné práci či odborném článku, tak kvůli rozeznání chyb v pracích jiných bychom se s ní měli alespoň trochu seznámit.

Nejčastěji obor kromě profesionálních statistiků využívají sociologové, psychologové, odborníci z humanitních studií a prakticky veškeří přírodovědci; máte tedy vysokou šanci, že i vás se statistika někdy bude týkat, až bude potřeba analyzovat nějaký psychologický dotazník, výsledky chemických pokusů či jiná data. V následující sérii článků vám stručně představíme úplné základy, které vám pomohou se ve statistice lépe zpočátku zorientovat a později snad i snáze pochopit hlubší problematiku.

Můžeme využít jednak popisnou statistiku, tedy zaměřit se vždy na jednu proměnnou a popsat její charakteristiky (např. průměr, modus, medián, rozptyl), jednak statistické metody analyzující vztahy mezi více proměnnými. Již dvakrát tu padlo zásadní slovo proměnná – to, jakého typu je, ovlivní naši práci s ní. Ze všeho nejdříve si tedy potřebujeme jednotlivé typy proměnných představit.

Jaký typ proměnné mám ve svém souboru dat?

Klasicky se proměnné dělí do čtyř skupin: na nominální (z nichž se někdy zvlášť vyčleňují binární), ordinální, intervalové a poměrové.

Nominální

Jedná se o proměnnou se slovními kategoriemi (popř. popsanými číselným kódem), které popisují všechny možnosti. Může to být například město narození, národnost či povolání. Zvláštní případ nastává, když existují pouze dvě možnosti – taková proměnná se pak někdy vyčleňuje jako binární a příkladem je třeba pohlaví (ať už ho označíme muž/žena, M/Z, 0/1 či jinak).

Ordinální

Jde o proměnné podobné nominálním, s tím rozdílem, že jsou uspořádané – existuje tam jasné pořadí. Příkladem je dosažená úroveň vzdělání, kde můžeme postupovat od žádného po základní, střední, střední s maturitou a vysokoškolské.

Intervalové

Zde se již setkáváme s proměnnými vyjádřenými spojitými číselnými hodnotami – to znamená, že v rozdělení nejsou žádné mezery, neexistují oddělení kategorie např. dvaceti a jednadvaceti stupňů Celsia; teoreticky můžeme teplotu měřit přesně až „donekonečna“, jednotlivé hodnoty na sebe navazují. V praxi samozřejmě uvádíme hodnoty na předem dohodnutý počet desetinných míst, většinou jedno až tři. U intervalových proměnných se ptáme na rozdíl hodnot – na to, o kolik stupňů vyšší je teplota v Praze oproti Kvildě apod.

Poměrové

I poměrové proměnné jsou číselné a spojité. Rozdílem oproti intervalovým je skutečnost, že u poměrových má smysl se ptát nejen na rozdíl, ale i podíl hodnot. Typickým příkladem je výška – více než to, že jsou třeba Evropané v průměru o několik centimetrů vyšší než Asiaté, nám řekne sdělení, o kolik procent jsou vyšší. Dělení na poměrové a intervalové proměnné není absolutní; mohli bychom se také ptát, o kolik procent tepleji než na Kvildě je v Praze, ale není to zvykem, u teplot jsme zvyklí pouze na popisování rozdílu a s ním počítáme; u výšky či hmotnosti často používáme i podíl (běžně vyjádřený v procentech).

Nyní jsme si vysvětlili základní typy statistických proměnných; v příští části série článků se dozvíte, jakou popisnou statistiku můžeme u jednotlivých typů použít a jak přehledně popíšeme vlastnosti našeho souboru dat – například výšku změřené populace, vzdělání skupiny lidí, meteorologické záznamy či původ studentů jedné školy z různých měst.

Autor článku

Julie Nováková  

Články ze sekce: STUDENT - NEPOUŽÍVAT