Co jsou stupně svobody?
Stupně svobody označuje maximální počet logicky nezávislých hodnot, což jsou hodnoty, které se mohou volně měnit, ve vzorku dat.
Klíč s sebou
- Stupně svobody se vztahuje na maximální počet logicky nezávislých hodnot, což jsou hodnoty, které se mohou volně měnit, ve vzorku dat. Stupně svobody se běžně diskutuje o různých formách testování hypotéz ve statistikách, jako je Chi- Square.Calculating Degrees of Freedom je klíčové, když se pokoušíme pochopit důležitost statistik Chi-Square a platnosti nulové hypotézy.
Porozumění stupňům svobody
Nejjednodušší způsob, jak koncepčně porozumět stupňům svobody, je prostřednictvím příkladu:
- Vezměme si vzorek dat sestávající z pěti jednoduchých celých čísel pro jednoduchost. Hodnoty mohly být libovolné číslo, aniž by mezi nimi existoval žádný známý vztah. Tento vzorek dat by teoreticky měl pět stupňů volnosti. Čtyři z čísel ve vzorku jsou {3, 8, 5 a 4} a průměr celého vzorku je odhalen jako 6. To musí znamenat, že páté číslo musí být 10. Nemůže to být nic jiného. Nemá svobodu měnit se. Stupně svobody pro tento vzorek jsou 4.
Vzorec pro stupně svobody se rovná velikosti vzorku dat minus jedna:
Cvičení Df = N − 1 kdekoli: Df = stupně volnosti N = velikost vzorku
Stupně svobody jsou běžně diskutovány ve vztahu k různým formám testování hypotéz ve statistikách, jako je například Chi-Square. Je nezbytné vypočítat stupně volnosti, když se pokoušíme pochopit důležitost statistik Chi-Square a platnosti nulové hypotézy.
Chi-Square testy
Existují dva různé druhy Chi-Square testů: test nezávislosti, který klade otázku vztahu, například: „Existuje vztah mezi pohlavím a skóre SAT?“; a test shody dobroty, který se ptá něco jako „Je-li mince hodena 100krát, přijde to 50krát hlavou a ocasem 50krát?“
Pro tyto testy se používají stupně volnosti k určení, zda lze určitou nulovou hypotézu odmítnout na základě celkového počtu proměnných a vzorků v experimentu. Například při zvažování výběru studentů a kurzů není velikost vzorku 30 nebo 40 studentů dostatečně velká, aby vygenerovala významná data. Získání stejných nebo podobných výsledků ze studie pomocí vzorku vzorku 400 nebo 500 studentů je platnější.
Historie stupňů svobody
Nejčasnější a nejzákladnější pojetí stupňů svobody bylo zaznamenáno na počátku 18. století, propojené v dílech matematika a astronoma Carla Friedricha Gaussa. Moderní použití a porozumění termínu bylo vysvětleno nejprve William Sealy Gosset, anglický statistik, v jeho článku “Pravděpodobná chyba střední hodnoty”, publikoval v Biometrika v 1908 pod jménem pera chránit jeho anonymitu.
Gosset ve svých spisech výslovně nepoužíval termín „Stupně svobody“. Vysvětlil však tento koncept v průběhu vývoje toho, co by nakonec bylo známé jako Studentova T-distribuce. Skutečný termín nebyl dělán populární dokud ne 1922. Anglický biolog a statistik Ronald Fisher začal používat termín “stupně svobody”, když on začal publikovat zprávy a data o jeho práci vyvíjet chi-čtverce.
