Naučte se používat statistiku: Začínáme testovat hypotézy

V minulých částech série o základech statistiky jsme si ukázali různé typy proměnných a druhy popisné statistiky dat, tentokrát už se pustíme do testování našich hypotéz a na praktických příkladech si ukážeme základní testy hypotéz o jednom výběru dat: Má inteligence studentů jedné školy normální rozložení a shoduje se její průměr s tím před deseti lety? Rodí se v praxi stejně chlapců a děvčat, nebo je poměr pohlaví vychýlený?

Většinou potřebujeme statistická data nejen k tomu, abychom mohli stručně popsat jejich vlastnosti, ale především proto, abychom mohli vyslovit závěr ohledně nějaké své domněnky – hypotézy. Například si můžeme myslet, že se za posledních deset let změnila inteligence studentů VŠ, a chceme to ověřit. Rozdíl mezi současnými studenty a průměrnou inteligencí tehdejších studentů je naše hypotéza, které ve statistice říkáme alternativní hypotéza – alternativní vůči nulové hypotéze. Nulová hypotéza je, že významný rozdíl neexistuje. Alternativní hypotéza v testu je naše domněnka, kterou se snažíme prokázat, nulová je její doplněk.

Čtěte také:

Kdy nám vyjde statisticky významný výsledek?

Test nám ukáže, zda je pravděpodobné, že platí naše alternativní hypotéza. Pracuje s tzv. hladinou signifikance neboli alfa – pravděpodobností, že jsme chybně zamítli nulovou hypotézu a přijali alternativní, která ve skutečnosti neplatí. Hladina je stanovena předem a většinou se pracuje s hodnotou 5 %, ale můžeme se setkat i s 1 %, 0.1 % a vzácně 10 %. Vyjde-li nám v testu p hodnota, tedy konkrétní pravděpodobnost chybného zamítnutí nulové hypotézy pro použitá data právě v tomto testu, menší než dopředu stanovená alfa, je náš výsledek signifikantní – statisticky významný. V zásadě čím je p hodnota menší, tím pravděpodobnější je, že náš výsledek není chybný. Zde budeme pracovat s alfou 5 %, která je nejčastěji používaná.

Pro každé typy proměnných a jejich kombinace existují různé testy, někdy i množství typů například podle toho, zda má číselná proměnná normální rozdělení (které v grafu můžeme znázornit Gaussovou křivkou, v praxi je to například inteligence v populaci), nebo ne. Tentokrát si ukážeme testy hypotéz o jednom výběru dat.

Mají naše data normální rozdělení?

Dejme tomu, že chceme zjistit, jestli se průměrná inteligence žáků naší vysoké školy za posledních deset let významně změnila a zda má normální rozdělení (jako má inteligence v populaci). Známe průměrnou inteligenci studentů z doby před deseti lety a nyní jsme získali seznam výsledků inteligenčních testů od současných studentů.

Normální rozdělení zjišťuje tzv. Shapiro-Wilkův test. U žádných testů si zde nebudeme představovat výpočty, na nichž stojí, a jen uvedeme, jak se používají. Každý statistický program, kterých existuje mnoho (SPSS, Statistica, R a další), v sobě tyto testy obsahuje; vzorce k výpočtům si zájemce o hlubší porozumění tomu, jak testy pracují, může snadno vyhledat na internetu. U Shapiro-Wilkova testu stačí upozornit, že nulová hypotéza zde znamená, že testy mají normální rozdělení – a alternativní říká, že mají jiné. Vyjde-li tedy p hodnota větší než 5 %, naše data mají normální rozdělení – neprokázali jsme alternativu.

Změnila se průměrná inteligence studentů?

S jedinou hodnotou dřívějšího průměru (nebo populačního, kdybychom chtěli testovat rozdíl v inteligenci studentů VŠ a celkové populace ČR) srovnáme data pomocí Studentova t-testu, někdy jen zkráceně t-testu. Tento test má jako předpoklad pro správný výpočet normální rozdělení dat. Statistickému programu zadáme, jaká je hodnota, s níž chceme současná data porovnat, a jaká je naše alternativní hypotéza. Jsou tu tři možnosti: Menší, dvojstranná či větší. V prvním případě se domníváme, že je inteligence současných studentů nižší než u dřívějších, v posledním naopak, že vzrostla.

Naše otázka ale zněla jen, zda se významně změnila. Neřekli jsme si předem, zda se podle nás zvýšila nebo snížila. Proto zde použijeme dvojstranný test. Pokud nám vyjde p hodnota menší než 5 %, můžeme zamítnout nulovou hypotézu a říci, že se inteligence studentů významně změnila. Pozor: Kdybychom z doby před deseti lety neměli jen průměr, ale také výsledky od každého studenta, neprováděli bychom jednovýběrový, ale dvojvýběrový t-test. Kromě zvolení typu testu je pro nás postup v programu (zadání alternativy, srovnání p hodnoty s alfou) totožný.

Jak je to u kvalitativních proměnných?

U proměnných, které nejsou kvantitativní, samozřejmě nelze t-test použít. Pokud chceme například otestovat, zda je v praxi pravděpodobnost narození chlapce a děvčete stejná, nebo se liší, použijeme test o pravděpodobnosti jevu. Zde máme jen dvě možnosti, když tedy vydělíme 100 % dvěma, vyjde nám pravděpodobnost 50 % pro každou. Test nám řekne, zda se v praxi skutečně narodí polovina chlapců a polovina dívek, nebo je skutečnost významně rozdílná. Nulová hypotéza je, že platí „padesát na padesát“, alternativní říká, že v praxi je pravděpodobnost jiná (opět můžeme i předem říci, zda si myslíme, že se rodí více chlapců nebo více dívek, a zadat to v programu do vstupních parametrů testu). Pokud tedy p hodnota vychází méně než 5 %, není praktický poměr pohlaví v našem souboru dat padesát na padesát, prokázali jsme alternativu.

Většinou ale testujeme nejen své domněnky ohledně vlastností jedné proměnné, ale to, jestli spolu více z nich významně souvisí. V příštích částech seriálu článků si proto představíme testování souvislostí mezi dvěma kvalitativními proměnnými, kvalitativní a číselnou proměnnou, dvěma číselnými veličinami a větším počtem proměnných.

Přihlášení

Naučte se používat statistiku: Začínáme testovat hypotézy

Kdy nám vyjde statisticky významný výsledek?

Mají naše data normální rozdělení?

Změnila se průměrná inteligence studentů?

Jak je to u kvalitativních proměnných?

Autor článku

Julie Nováková

Češi propadli trendu rychlého stravování, počet fastfoodů se bude zvyšovat

Andrea Papoušková: Nikdy to nevzdávej

Vylepšete si životopis během prázdnin!

Finanční plán na studia

Úraz během brigády ihned oznamte!