Co je Analýza variace (ANOVA)?
Analýza rozptylu (ANOVA) je analytický nástroj používaný ve statistice, který rozděluje pozorovanou agregační variabilitu nalezenou uvnitř datové sady na dvě části: systematické faktory a náhodné faktory. Systematické faktory mají statistický vliv na daný soubor dat, zatímco náhodné faktory nikoli. Analytici používají ANOVA test k určení vlivu nezávislých proměnných na závislou proměnnou v regresní studii.
Metody t- a z-testy vyvinuté ve 20. století byly použity pro statistickou analýzu až do roku 1918, kdy Ronald Fisher vytvořil analýzu rozptylové metody. ANOVA se také nazývá Fisherova analýza rozptylu a jedná se o rozšíření t- a z-testů. Tento termín se stal známým v roce 1925 poté, co se objevil v Fisherově knize „Statistické metody pro výzkumné pracovníky“. Byl zaměstnán v experimentální psychologii a později rozšířen na předměty, které byly složitější.
Vzorec pro ANOVA je:
Cvičení F = MSEMST kde: F = ANOVA koeficientMST = Střední součet čtverců v důsledku ošetřeníMSE = Střední součet čtverců v důsledku chyby
Co odhaluje analýza variací?
Test ANOVA je počátečním krokem v analýze faktorů, které ovlivňují daný soubor dat. Po dokončení testu provede analytik další testování metodických faktorů, které měřitelně přispívají k nekonzistenci datové sady. Analytik využívá výsledky testu ANOVA ve f-testu k vytvoření dalších dat, která jsou v souladu s navrhovanými regresními modely.
ANOVA test umožňuje porovnání více než dvou skupin současně a určit, zda mezi nimi existuje vztah. Výsledek vzorce ANOVA, statistika F (také nazývaná F-poměr), umožňuje analýzu více skupin dat, aby se určila variabilita mezi vzorky a uvnitř vzorků.
Pokud mezi testovanými skupinami neexistuje skutečný rozdíl, který se nazývá nulová hypotéza, bude výsledek statistiky ANOVA F-poměru blízký 1. Kolísání jeho vzorkování bude pravděpodobně následovat distribuci Fisher F. Toto je vlastně skupina distribučních funkcí se dvěma charakteristickými čísly, která se nazývají stupně čitatelské volnosti a jmenovatelské stupně volnosti.
Klíč s sebou
- Analýza rozptylu, neboli ANOVA, je statistická metoda, která rozděluje pozorovaná data rozptylu na různé komponenty, aby se použily pro další testy. Jednosměrná ANOVA se používá pro tři nebo více skupin dat, k získání informací o vztahu mezi závislými a nezávislé proměnné.Pokud neexistuje skutečná odchylka mezi skupinami, měl by se poměr ANOVA rovnat 1.
Příklad použití ANOVA
Výzkumný pracovník by například mohl vyzkoušet studenty z více vysokých škol, aby zjistil, zda studenti z jedné z vysokých škol trvale předčí studenty z jiných vysokých škol. V obchodní aplikaci může výzkumný a vývojový pracovník testovat dva různé procesy vytváření produktu, aby zjistil, zda je jeden proces lepší z hlediska efektivnosti než druhý.
Použitý typ testu ANOVA závisí na řadě faktorů. Používá se, když data musí být experimentální. Analýza rozptylu se používá, pokud neexistuje žádný přístup ke statistickému softwaru, který má za následek ruční výpočet ANOVA. Je to jednoduché použití a nejlépe se hodí pro malé vzorky. U mnoha experimentálních návrhů musí být velikosti vzorků stejné pro různé kombinace úrovní faktorů.
ANOVA je užitečná pro testování tří nebo více proměnných. Je to podobné vícenásobným dvou-ukázkovým t-testům. Výsledkem je však méně chyb typu I a je vhodný pro řadu problémů. ANOVA seskupuje rozdíly porovnáváním prostředků každé skupiny a zahrnuje rozložení rozptylu do různých zdrojů. Používá se u subjektů, testovacích skupin, mezi skupinami a uvnitř skupin.
One-Way ANOVA versus Two-Way ANOVA
Existují dva typy ANOVA: jednosměrný (nebo jednosměrný) a obousměrný. Jednosměrný nebo obousměrný odkazuje na počet nezávislých proměnných ve vaší analýze rozptylového testu. Jednosměrná ANOVA vyhodnocuje dopad jediného faktoru na jedinou proměnnou odezvy. Určuje, zda jsou všechny vzorky stejné. Jednosměrná ANOVA se používá k určení, zda existují statisticky významné rozdíly mezi průměrem tří nebo více nezávislých (nepříbuzných) skupin.
Obousměrná ANOVA je rozšíření jednosměrné ANOVA. Jednosměrně máte jednu nezávislou proměnnou ovlivňující závislou proměnnou. U dvousměrné ANOVA existují dva nezávislí. Například obousměrná ANOVA umožňuje společnosti porovnat produktivitu pracovníků na základě dvou nezávislých proměnných, jako je plat a sada dovedností. Používá se k pozorování interakce mezi těmito dvěma faktory a k testování účinku dvou faktorů současně.
