Obsah
- Co je T-test?
- Vysvětlení T-testu
- Nejednoznačné výsledky testu
- Předpoklady T-testu
- Výpočet T-testů
- Korelovaný (nebo spárovaný) T-test
- Rovnoměrná odchylka (sdružená) T-zkouška
- T-test s nestejnou variabilitou
- Určení, který T-test použít
- Příklad T-testu s nestejnou variací
Co je T-test?
T-test je typ inferenciální statistiky, která se používá k určení, zda existuje významný rozdíl mezi prostředkem dvou skupin, který může souviset s určitými znaky. Většinou se používá, když soubory dat, stejně jako soubory dat zaznamenané jako výsledek 100násobného převrácení mince, budou sledovat normální rozdělení a mohou mít neznámé odchylky. T-test se používá jako nástroj pro testování hypotéz, který umožňuje testování předpokladů použitelných pro populaci.
T-test zkoumá t-statistiku, hodnoty t-distribuce a stupně volnosti pro stanovení pravděpodobnosti rozdílu mezi dvěma soubory dat. K provedení testu se třemi nebo více proměnnými je nutné použít analýzu rozptylu.
T-test
Vysvětlení T-testu
T-test nám v podstatě umožňuje porovnat průměrné hodnoty těchto dvou datových souborů a zjistit, zda pocházejí ze stejné populace. Ve výše uvedených příkladech, pokud bychom měli odebrat vzorek studentů ze třídy A a jiný vzorek studentů ze třídy B, neočekávali bychom, že budou mít přesně stejný průměr a standardní odchylku. Podobně by vzorky odebrané z kontrolní skupiny krmené placebem a vzorky odebrané ze skupiny předepsané lékem měly mít mírně odlišnou střední a standardní odchylku.
Matematicky t-test odebere vzorek z každé ze dvou sad a stanoví problémové prohlášení za předpokladu nulové hypotézy, že oba prostředky jsou si rovny. Na základě příslušných vzorců jsou některé hodnoty vypočteny a porovnány se standardními hodnotami a předpokládaná nulová hypotéza je odpovídajícím způsobem akceptována nebo odmítnuta.
Pokud je nulová hypotéza způsobilá k odmítnutí, znamená to, že údaje jsou silné a nejsou náhodné. T-test je jen jedním z mnoha testů použitých pro tento účel. Statistici musí navíc použít jiné testy než t-test, aby prozkoumali více proměnných a testy s většími velikostmi vzorku. Pro velkou velikost vzorku používají statistici z-test. Mezi další možnosti testování patří test chi-square a f-test.
Existují tři typy t-testů a jsou klasifikovány jako závislé a nezávislé t-testy.
Klíč s sebou
- T-test je typ inferenciální statistiky používané k určení, zda existuje významný rozdíl mezi prostředky dvou skupin, které mohou souviset s určitými vlastnostmi. T-test je jedním z mnoha testů používaných pro účely testování hypotéz. Ve statistice. Výpočet t-testu vyžaduje tři klíčové hodnoty dat. Zahrnují rozdíl mezi středními hodnotami z každé sady dat (tzv. Střední rozdíl), standardní odchylkou každé skupiny a počtem hodnot dat každé skupiny. Existuje několik různých typů t-testu, které lze provést v závislosti na o požadovaných datech a typu analýzy.
Nejednoznačné výsledky testu
Uvažte, že výrobce léčiv chce testovat nově vynalezený lék. Sleduje standardní postup zkoušení léku na jedné skupině pacientů a podávání placeba jiné skupině, která se nazývá kontrolní skupina. Placebo, které se podává kontrolní skupině, je látkou bez zamýšlené terapeutické hodnoty a slouží jako měřítko k měření toho, jak reaguje druhá skupina, které je podáno skutečné léčivo.
Po drogové studii členové kontrolní skupiny krmené placebem hlásili zvýšení průměrné délky života o tři roky, zatímco členové skupiny, kterým byl nový lék předepsán, hlásí zvýšení průměrné délky života o čtyři roky. Okamžité pozorování může naznačovat, že droga skutečně funguje, protože výsledky jsou pro skupinu, která ji používá, lepší. Je však také možné, že pozorování může být způsobeno náhodným výskytem, zejména překvapením. T-test je užitečný k závěru, zda jsou výsledky skutečně správné a aplikovatelné na celou populaci.
Ve škole dosáhlo 100 studentů třídy A průměrně 85% se standardní odchylkou 3%. Dalších 100 studentů náležejících do třídy B dosáhlo v průměru 87% se standardní odchylkou 4%. Zatímco průměr třídy B je lepší než výkon třídy A, nemusí být správné přeskočit k závěru, že celkový výkon studentů ve třídě B je lepší než výkon studentů ve třídě A. Je to proto, že spolu s znamená, že standardní odchylka třídy B je také vyšší než odchylka třídy A. Znamená to, že jejich extrémní procenta, na spodních a vyšších stranách, byla mnohem rozprostřena ve srovnání s třídou A. T-test může pomoci určit která třída si vedla lépe.
Předpoklady T-testu
- První předpoklad týkající se t-testů se týká rozsahu měření. Předpoklad pro t-test je ten, že měřítko použité na shromážděná data následuje kontinuální nebo pořadové měřítko, jako jsou skóre pro IQ test. Druhým předpokladem je to z jednoduchého náhodného vzorku, že data jsou Shromážděné z reprezentativní, náhodně vybrané části celkové populace. Třetí předpoklad jsou data, když jsou vynesena do grafu, výsledkem je normální rozdělení, křivka ve tvaru zvonku. Použije se čtvrtý předpoklad, který se použije v přiměřeně velké velikosti vzorku. Větší velikost vzorku znamená, že rozdělení výsledků by se mělo přiblížit k normální zvonovité křivce. Konečným předpokladem je homogenita rozptylu. Homogenní nebo stejná variance existuje, když jsou standardní odchylky vzorků přibližně stejné.
Výpočet T-testů
Výpočet t-testu vyžaduje tři klíčové hodnoty dat. Zahrnují rozdíl mezi středními hodnotami z každé sady dat (nazývané průměrný rozdíl), standardní odchylka každé skupiny a počet hodnot dat každé skupiny.
Výsledek t-testu vytváří t-hodnotu. Tato vypočtená t-hodnota je poté porovnána s hodnotou získanou z tabulky kritických hodnot (nazývané T-distribuční tabulka). Toto srovnání pomáhá určit, jak pravděpodobný je rozdíl mezi prostředky, které se vyskytly náhodou, nebo zda datové soubory mají skutečně vnitřní rozdíly. T-test se ptá, zda rozdíl mezi skupinami představuje skutečný rozdíl ve studii, nebo zda je pravděpodobně bezvýznamný statistický rozdíl.
T-distribuční tabulky
Tabulka T-distribuce je k dispozici ve formátech s jedním ocasem a dvěma ocasy. První se používá k posouzení případů, které mají pevnou hodnotu nebo rozmezí s jasným směrem (kladným nebo záporným). Jaká je například pravděpodobnost, že výstupní hodnota zůstane pod -3, nebo se dostane více než sedm, když hodí kostkou? Ten se používá pro analýzu vázaného rozsahu, jako je dotaz, zda souřadnice klesnou mezi -2 a +2.
Výpočty lze provádět pomocí standardních softwarových programů, které podporují nezbytné statistické funkce, jako jsou funkce nalezené v MS Excel.
T-hodnoty a stupně svobody
Výsledkem t-testu jsou dvě hodnoty: t-hodnota a stupně volnosti. Hodnota t je poměr rozdílu mezi průměrem dvou sad vzorků a rozdílu, který existuje v sadách vzorků. Zatímco hodnota čitatele (rozdíl mezi průměrem dvou sad vzorků) je snadno vypočítatelná, jmenovatel (rozdíl, který existuje v sadách vzorků) se může stát trochu komplikovaným v závislosti na typu zahrnutých datových hodnot. Jmenovatelem poměru je měření rozptylu nebo variability. Vyšší hodnoty t-hodnoty, také nazývané t-skóre, znamenají, že mezi dvěma sadami vzorků existuje velký rozdíl. Čím menší je hodnota t, tím větší je podobnost mezi dvěma sadami vzorků.
- Velké t-skóre znamená, že skupiny jsou různé. Malé t-skóre ukazuje, že skupiny jsou podobné.
Stupně svobody se vztahují k hodnotám ve studii, která má svobodu měnit se a jsou zásadní pro posouzení důležitosti a platnosti nulové hypotézy. Výpočet těchto hodnot obvykle závisí na počtu datových záznamů dostupných ve vzorkové sadě.
Korelovaný (nebo spárovaný) T-test
Korelovaný t-test se provádí, když se vzorky obvykle skládají ze spárovaných párů podobných jednotek, nebo když se vyskytnou případy opakovaných měření. Například mohou existovat případy opakovaného testování stejných pacientů - před a po provedení konkrétní léčby. V takových případech je každý pacient používán jako kontrolní vzorek proti sobě.
Tato metoda platí také pro případy, kdy jsou vzorky nějakým způsobem spřízněny nebo mají shodné vlastnosti, jako je srovnávací analýza zahrnující děti, rodiče nebo sourozence. Korelované nebo spárované t-testy jsou závislého typu, protože se jedná o případy, kdy jsou tyto dvě sady vzorků propojeny.
Vzorec pro výpočet t-hodnoty a stupňů volnosti pro párový t-test je:
- Průměr 1 a průměr 2 jsou průměrné hodnoty každé ze sad vzorků, zatímco var1 a var2 představují rozptyl každé ze sad vzorků.
Zbývající dva typy patří k nezávislým t-testům. Ukázky těchto typů jsou vybrány nezávisle na sobě - to znamená, že datové sady ve dvou skupinách neodkazují na stejné hodnoty. Zahrnují případy, jako je skupina 100 pacientů rozdělených do dvou sad po 50 pacientech. Jedna ze skupin se stane kontrolní skupinou a dostane placebo, zatímco druhá skupina dostává předepsanou léčbu. To představuje dvě nezávislé skupiny vzorků, které nejsou vzájemně spárovány.
T-test se stejnou variací (nebo sdruženou)
T-test se stejným rozptylem se používá, když je počet vzorků v každé skupině stejný nebo rozptyl obou souborů dat je podobný. Pro výpočet t-hodnoty a stupňů volnosti pro t-test se stejnými odchylkami se používá následující vzorec:
Cvičení T-hodnota = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 průměr1 − průměr2 kde: průměr1 a průměr2 = průměrné hodnoty každé sady vzorků1 and var2 = Variace každé ze vzorků setn1 a n2 = Počet záznamů v každé sadě vzorků
a, Cvičení Stupně svobody = n1 + n2−2where: n1 an2 = počet záznamů v každé vzorkové sadě
T-test s nestejnou variabilitou
Nerovnoměrný rozptyl t-test se používá, když je počet vzorků v každé skupině odlišný a rozptyl obou datových souborů je také odlišný. Tento test se také nazývá Welchův t-test. Pro výpočet t-hodnoty a stupňů volnosti pro t-test s nestejnou odchylkou se používá následující vzorec:
Cvičení T-hodnota = n1var12 + n2var22 průměrná1 - střední2 kde: průměrná1 a průměrná2 = průměrné hodnoty každého ze souboru vzorkůvar1 a var2 = varianta každého ze souboru vzorkůn1 an2 = počet záznamů v každé sadě vzorků
a, Cvičení Stupně svobody = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 kde: var1 a var2 = Variace každé ze sad vzorků1n2 a n2 = číslo záznamů v každé sadě vzorků
Stanovení správného T-testu k použití
Následující vývojový diagram lze použít k určení toho, který t-test by měl být použit na základě charakteristik sad vzorků. Mezi klíčové položky, které je třeba zvážit, patří, zda jsou záznamy vzorků podobné, počet datových záznamů v každé sadě vzorků a rozptyl každé sady vzorků.
Obrázek Julie Bang © Investopedia 2019
Příklad T-testu s nestejnou variací
Předpokládejme, že provádíme diagonální měření obrazů získaných v umělecké galerii. Jedna skupina vzorků zahrnuje 10 obrazů, zatímco druhá zahrnuje 20 obrazů. Datové soubory s odpovídajícími středními a rozptylovými hodnotami jsou následující:
Sada 1 | Sada 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21, 95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Znamenat | 19.4 | 21.6 |
Odchylka | 1.4 | 17.1 |
Ačkoli průměr sady 2 je vyšší než průměr sady 1, nemůžeme dojít k závěru, že všechny obrazy mají průměrnou délku kolem 21, 6 jednotek, protože rozptyl sady 2 je výrazně vyšší než sada 1. Je to náhodou nebo skutečně existují rozdíly v celkové populaci všech obrazů obdržených v galerii umění? Stanovíme problém předpokládáním nulové hypotézy, že průměr je stejný mezi dvěma sadami vzorků, a provedeme t-test, abychom potvrdili, zda hypotéza zůstává pravdivá.
Protože počet datových záznamů je odlišný (n1 = 10 a n2 = 20) a odchylka je také různá, pro výše uvedenou sadu dat se vypočte t-hodnota a stupně volnosti pomocí vzorce uvedeného v testu nestejné variace T sekce.
Hodnota t je -2, 24787. Protože znaménko mínus může být ignorováno při porovnání dvou t-hodnot, je vypočítaná hodnota 2, 24787.
Hodnota stupňů volnosti je 24, 38 a je snížena na 24, protože definice vzorce vyžaduje zaokrouhlení hodnoty na nejnižší možnou celočíselnou hodnotu.
Kdykoli se předpokládá normální rozdělení, lze jako kritérium pro přijetí určit úroveň pravděpodobnosti (úroveň alfa, úroveň významnosti, p ). Ve většině případů lze předpokládat 5% hodnotu.
Při použití hodnoty stupně volnosti jako 24 a 5% úrovně významnosti poskytuje tabulka distribuce hodnot t hodnotu 2, 064. Porovnání této hodnoty s vypočtenou hodnotou 2, 247 ukazuje, že vypočtená t-hodnota je větší než hodnota tabulky při hladině významnosti 5%. Proto je bezpečné odmítnout nulovou hypotézu, že neexistuje žádný rozdíl mezi prostředky. Soubor populace má vnitřní rozdíly a nejsou náhodou.
Porovnání investičních účtů × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu. Název poskytovatele PopisSouvisející termíny
Jak funguje analýza rozptylu (ANOVA) Analýza rozptylu (ANOVA) je nástroj statistické analýzy, který rozděluje celkovou variabilitu nalezenou v datovém souboru na dvě složky: náhodné a systematické faktory. více Definice Z-testu Z-test je statistický test, který se používá ke stanovení, zda se dva prostředky populace liší, jsou-li známy rozdíly a velikost vzorku je velká. více Definice stupňů svobody Stupně svobody označuje maximální počet logicky nezávislých hodnot, což jsou hodnoty, které mají volnost měnit se ve vzorku dat. více Porozumění distribuci T Distribuce AT je typ pravděpodobnostní funkce, která je vhodná pro odhad parametrů populace pro malé velikosti vzorku nebo neznámé odchylky. více Co měří Semi-odchylka Semi-odchylka je metoda hodnocení podprůměrných výkyvů v návratnosti investic. Používá se jako alternativa ke standardní odchylce. více Bonferroni test Bonferroni test je typ vícenásobného srovnávacího testu používaného ve statistické analýze. více partnerských odkazůSouvisející články
Ekonomika
Jaké jsou předpoklady při provádění t-testu?
Řízení rizik
Využití historické volatility k měření budoucího rizika
Strategie obchodování s akciemi a vzdělávání
Jak používat Excel k simulaci cen akcií
Finanční ukazatele
Jak vypočítáte IRR v Excelu?
Matematika a statistika
Co je relativní standardní chyba
Finanční ukazatele
Jaký je vzorec pro výpočet čisté současné hodnoty (NPV) v Excelu?
