Nejčastěji obor kromě profesionálních statistiků využívají sociologové, psychologové, odborníci z humanitních studií a prakticky veškeří přírodovědci; máte tedy vysokou šanci, že i vás se statistika někdy bude týkat, až bude potřeba analyzovat nějaký psychologický dotazník, výsledky chemických pokusů či jiná data. V následující sérii článků vám stručně představíme úplné základy, které vám pomohou se ve statistice lépe zpočátku zorientovat a později snad i snáze pochopit hlubší problematiku.
Můžeme využít jednak popisnou statistiku, tedy zaměřit se vždy na jednu proměnnou a popsat její charakteristiky (např. průměr, modus, medián, rozptyl), jednak statistické metody analyzující vztahy mezi více proměnnými. Již dvakrát tu padlo zásadní slovo proměnná – to, jakého typu je, ovlivní naši práci s ní. Ze všeho nejdříve si tedy potřebujeme jednotlivé typy proměnných představit.
Jaký typ proměnné mám ve svém souboru dat?
Klasicky se proměnné dělí do čtyř skupin: na nominální (z nichž se někdy zvlášť vyčleňují binární), ordinální, intervalové a poměrové.
Nominální
Jedná se o proměnnou se slovními kategoriemi (popř. popsanými číselným kódem), které popisují všechny možnosti. Může to být například město narození, národnost či povolání. Zvláštní případ nastává, když existují pouze dvě možnosti – taková proměnná se pak někdy vyčleňuje jako binární a příkladem je třeba pohlaví (ať už ho označíme muž/žena, M/Z, 0/1 či jinak).
Ordinální
Jde o proměnné podobné nominálním, s tím rozdílem, že jsou uspořádané – existuje tam jasné pořadí. Příkladem je dosažená úroveň vzdělání, kde můžeme postupovat od žádného po základní, střední, střední s maturitou a vysokoškolské.
Intervalové
Zde se již setkáváme s proměnnými vyjádřenými spojitými číselnými hodnotami – to znamená, že v rozdělení nejsou žádné mezery, neexistují oddělení kategorie např. dvaceti a jednadvaceti stupňů Celsia; teoreticky můžeme teplotu měřit přesně až „donekonečna“, jednotlivé hodnoty na sebe navazují. V praxi samozřejmě uvádíme hodnoty na předem dohodnutý počet desetinných míst, většinou jedno až tři. U intervalových proměnných se ptáme na rozdíl hodnot – na to, o kolik stupňů vyšší je teplota v Praze oproti Kvildě apod.
Poměrové
I poměrové proměnné jsou číselné a spojité. Rozdílem oproti intervalovým je skutečnost, že u poměrových má smysl se ptát nejen na rozdíl, ale i podíl hodnot. Typickým příkladem je výška – více než to, že jsou třeba Evropané v průměru o několik centimetrů vyšší než Asiaté, nám řekne sdělení, o kolik procent jsou vyšší. Dělení na poměrové a intervalové proměnné není absolutní; mohli bychom se také ptát, o kolik procent tepleji než na Kvildě je v Praze, ale není to zvykem, u teplot jsme zvyklí pouze na popisování rozdílu a s ním počítáme; u výšky či hmotnosti často používáme i podíl (běžně vyjádřený v procentech).
Nyní jsme si vysvětlili základní typy statistických proměnných; v příští části série článků se dozvíte, jakou popisnou statistiku můžeme u jednotlivých typů použít a jak přehledně popíšeme vlastnosti našeho souboru dat – například výšku změřené populace, vzdělání skupiny lidí, meteorologické záznamy či původ studentů jedné školy z různých měst.



Test ojetiny: Možná se vyplatí nejít automaticky pro Škodu. Opel Insignia II je opomíjenou ojetinou za skvělé peníze
Tohle měla být Škoda pro chudé. Sagitta představovala zajímavý nápad, ale do série se nedostala
Na Slovensku nově může člověk dostat pokutu za rychlost, pokud poběží na autobus. Po chodníku se teď musí chodit a jezdit nanejvýš 6 km/h
Test Volkswagen Caravelle Long 2.0 TDI 4Motion: Mikrobus do nepohody
Malý náklaďáček mnoha jmen: Škoda/Aero/Praga (A) 150 byla nedoceněným československým dříčem
