Co je to dvoukřídlý test?
Ve statistice je oboustranný test metoda, ve které je kritická oblast distribuce oboustranná a testuje, zda je vzorek větší nebo menší než určitý rozsah hodnot. Používá se při testování nulové hypotézy a testování statistické významnosti. Pokud testovaný vzorek spadne do jedné z kritických oblastí, je místo nulové hypotézy akceptována alternativní hypotéza. Dvou-sledovaný test získá své jméno na základě testování oblasti pod oběma konci normální distribuce, ačkoli test může být použit v jiných neobvyklých distribucích.
Klíč s sebou
- Ve statistice je oboustranný test metoda, ve které je kritická oblast distribuce oboustranná a testuje, zda je vzorek větší nebo menší než určitý rozsah hodnot. Používá se při testování a testování s nulovou hypotézou. pro statistickou významnost. Pokud testovaný vzorek spadne do jedné z kritických oblastí, je místo nulové hypotézy akceptována alternativní hypotéza. Podle konvencí se ke stanovení významnosti na úrovni 5% použijí dvoustranné testy, což znamená, že každá strana distribuce je snížena na 2, 5%.
Dávejte pozor, abyste si všimli, že statistický test je jednostranný nebo dvoustranný, protože to výrazně ovlivní interpretaci modelu.
Obousměrný test na významnost. Investopedia
Jak funguje test se dvěma ocasy
Základním pojmem inferenciální statistiky je testování hypotéz, které se provádí za účelem určení, zda je nárok pravdivý nebo ne, s ohledem na parametr populace. Testování, které je naprogramováno tak, aby ukazovalo, zda průměr vzorku je významně větší než a významně menší než průměr populace, se označuje jako test se dvěma ocasy.
Zkouška s dvěma ocasy je navržena tak, aby prozkoumala obě strany specifikovaného rozsahu dat, jak je určeno příslušným rozdělením pravděpodobnosti. Rozdělení pravděpodobnosti by mělo představovat pravděpodobnost určitého výsledku založeného na předem stanovených standardech. To vyžaduje nastavení limitu označujícího nejvyšší (nebo horní) a nejnižší (nebo nižší) akceptované hodnoty proměnné zahrnuté v rozsahu. Jakýkoli datový bod, který existuje nad horní hranicí nebo pod dolní hranicí, je považován za mimo akceptační rozsah a v oblasti označované jako rozsah odmítnutí.
Neexistuje žádná vlastní norma, pokud jde o počet datových bodů, které musí existovat v rozsahu přijatelnosti. V případech, kdy je vyžadována přesnost, například při výrobě farmaceutických léčiv, může být zavedena míra odmítnutí 0, 001% nebo méně. V případech, kdy je přesnost méně kritická, například počet potravin v balení produktu, může být vhodná míra odmítnutí 5%.
Příklad testu se dvěma ocasy
Jako hypotetický příklad si představte, že nový makléř (XYZ) tvrdí, že jeho poplatky za zprostředkování jsou nižší než poplatky vašeho současného makléře (ABC). Data dostupná od nezávislé výzkumné firmy naznačují, že průměrná a standardní odchylka všech klientů brokerů ABC je 18 $ a 6 $.
Je odebrán vzorek 100 klientů ABC a vypočteny poplatky za zprostředkování podle nových sazeb brokera XYZ. Je-li průměr vzorku 18, 75 USD a standardní směrodatná odchylka je 6 USD, je možné vyvodit jakýkoli rozdíl ohledně průměrného účtu za zprostředkování mezi ABC a XYZ brokerem?
- H 0: Nulová hypotéza: průměr = 18H 1: Alternativní hypotéza: průměr <> 18 (To je to, co chceme dokázat.) Oblast odmítnutí: Z <= - Z 2, 5 a Z> = Z 2, 5 (za předpokladu 5% úrovně významnosti, split 2, 5 na každé straně). Z = (průměr vzorku - průměr) / (std-dev / sqrt (počet vzorků)) = (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25
Tato vypočtená hodnota Z leží mezi dvěma limity definovanými: - Z 2, 5 = -1, 96 a Z 2, 5 = 1, 96.
Tím dochází k závěru, že neexistují dostatečné důkazy, které by umožňovaly vyvozovat, že existuje rozdíl mezi mírami vašeho stávajícího brokera a nového brokera. Alternativně vede p-hodnota = P (Z <1, 25) + P (Z> 1, 25) = 2 * 0, 1056 = 0, 2112 = 21, 12%, což je více než 0, 05 nebo 5%, ke stejnému závěru.
Zvláštní úvahy: Náhodné vzorkování
Zkoušku s dvěma ocasy lze také použít prakticky při určitých výrobních činnostech ve firmě, například při výrobě a balení cukrovinek v určitém zařízení. Pokud výrobní závod označí za svůj cíl 50 cukrovinek v jednom sáčku s přijatelnou distribucí 45 až 55 cukrovinek, považuje se jakýkoli pytel nalezený v množství nižším než 45 nebo vyšším než 55 v rozsahu odmítnutí.
Aby se potvrdilo, že jsou obalové mechanismy správně kalibrovány, aby splňovaly očekávaný výstup, může být odebrán náhodný výběr vzorků, aby se potvrdila přesnost. Aby byly obalové mechanismy považovány za přesné, je žádoucí průměrně 50 bonbónů na sáček s odpovídající distribucí. Kromě toho počet pytlů, které spadají do rozsahu odmítnutí, musí spadat do limitu distribuce pravděpodobnosti považovaného za přijatelný jako míra chyb.
Pokud je zjištěna nepřijatelná míra odmítnutí nebo průměrná odchylka příliš daleko od požadovaného průměru, může být nutné opravit zařízení nebo přidružené zařízení k opravě chyby. Pravidelné používání dvoustranných testovacích metod může pomoci zajistit dlouhodobé udržení produkčních limitů.
Dvoukřídlý versus jednokřídlý test
Pokud je stanoven test hypotéz, který ukazuje, že průměr vzorku by byl vyšší nebo nižší než průměr populace, označuje se to jako jednostranný test. Jednostranný test se nazývá testováním oblasti pod jedním z ocasů (stran) normální distribuce. Při použití jednostranného testu analytik testuje možnost vztahu v jednom směru zájmu a zcela ignoruje možnost vztahu v jiném směru.
Pokud testovaný vzorek spadne do jednostranné kritické oblasti, bude místo nulové hypotézy akceptována alternativní hypotéza. Jednostranný test je také známý jako směrová hypotéza nebo směrový test.
