Co je interval spolehlivosti?
Interval spolehlivosti ve statistikách označuje pravděpodobnost, že parametr populace klesne mezi dvěma nastavenými hodnotami po určitou dobu. Intervaly spolehlivosti měří míru nejistoty nebo jistoty v metodě odběru vzorků. Interval spolehlivosti může nabývat libovolného počtu pravděpodobností, přičemž nejčastější je 95% nebo 99% úroveň spolehlivosti.
Interval spolehlivosti a úroveň spolehlivosti jsou ve vzájemném vztahu, ale nejsou úplně stejné.
Porozumění intervalu spolehlivosti
Statistici používají intervaly spolehlivosti k měření nejistoty. Výzkumník například vybere různé vzorky náhodně ze stejné populace a vypočítá interval spolehlivosti pro každý vzorek. Výsledné datové sady jsou různé; některé intervaly zahrnují skutečný parametr populace a jiné nikoli.
Interval spolehlivosti je rozmezí hodnot, které by pravděpodobně obsahovaly neznámý parametr populace. Úroveň spolehlivosti označuje procento pravděpodobnosti nebo jistoty, že interval spolehlivosti bude obsahovat skutečný parametr populace, když mnohokrát nakreslíte náhodný vzorek. Nebo řečeno: „Jsme si 99% jistí ( úroveň spolehlivosti), že většina těchto datových sad (intervaly spolehlivosti) obsahuje skutečný parametr populace.“
Klíč s sebou
- Interval spolehlivosti vypočítává pravděpodobnost, že parametr populace klesne mezi dvě nastavené hodnoty. Intervaly spolehlivosti měří míru nejistoty nebo jistoty v metodě vzorkování. Nejčastěji intervaly spolehlivosti odrážejí úrovně spolehlivosti 95% nebo 99%.
Výpočet intervalu spolehlivosti
Předpokládejme, že skupina vědců studuje výšky basketbalových hráčů středních škol. Vědci odebírají náhodný vzorek z populace a stanoví průměrnou výšku 74 palců. Průměr 74 palců je bodový odhad průměrné populace. Bodový odhad sám o sobě má omezenou užitečnost, protože neodhaluje nejistotu spojenou s odhadem; nemáte dobrý pocit, jak daleko může být tento průměr 74 palců od průměru populace. Chybí však míra nejistoty v tomto jediném vzorku.
Intervaly spolehlivosti poskytují více informací než bodové odhady. Stanovením 95% intervalu spolehlivosti s použitím střední a standardní odchylky vzorku a za předpokladu normálního rozdělení, jak je reprezentováno zvonovou křivkou, se vědci dostanou k horní a dolní hranici, která obsahuje skutečný průměr 95% času. Předpokládejme, že interval je mezi 72 palci a 76 palci. Pokud vědci odeberou 100 náhodných vzorků z populace basketbalistů středních škol jako celku, průměr by měl klesnout mezi 72 a 76 palců v 95 z těchto vzorků.
Pokud vědci chtějí ještě větší důvěru, mohou interval prodloužit na 99%. Pokud tak učiníte, vytvoří se širší rozpětí, protože to vytváří prostor pro větší počet prostředků vzorku. Pokud stanoví interval spolehlivosti 99% jako mezi 70 palci a 78 palci, mohou očekávat, že 99 ze 100 hodnocených vzorků bude obsahovat střední hodnotu mezi těmito čísly. Úroveň spolehlivosti 90% znamená, že bychom očekávali, že 90% intervalových odhadů bude zahrnovat parametr populace. Stejně tak 99% úroveň spolehlivosti znamená, že 95% intervalů bude zahrnovat parametr.
Časté mylné představy o intervalu spolehlivosti
Největší mylná představa o intervalech spolehlivosti je v tom, že představují procento dat z daného vzorku, které spadají mezi horní a dolní mez. Například je možné chybně interpretovat výše uvedený 99% interval spolehlivosti 70 až 78 palců, což naznačuje, že 99% dat v náhodném vzorku spadá mezi tato čísla. To je nesprávné, i když existuje samostatná metoda statistické analýzy, která takové určení provádí. To zahrnuje identifikaci střední a standardní odchylky vzorku a vykreslení těchto hodnot na zvonovou křivku.
