Co je to chyba vzorkování?
Chyba vzorkování je statistická chyba, ke které dochází, když analytik nevybere vzorek, který představuje celou populaci dat a výsledky nalezené ve vzorku nepředstavují výsledky, které by byly získány z celé populace. Vzorkování je analýza prováděná výběrem řady pozorování z větší populace a výběr může způsobit chyby vzorkování i chyby neprovedení vzorkování.
Klíč s sebou
- Chyba vzorkování je statistická chyba, ke které dochází, když analytik nevybere vzorek, který představuje celou populaci dat. Výsledky zjištěné ve vzorku tedy nepředstavují výsledky, které by byly získány z celé populace. Chyba vzorkování může být snížena náhodným výběrem vzorku a / nebo zvýšením počtu pozorování.
Porozumění chybám vzorkování
Chyba vzorkování je odchylka ve vzorkované hodnotě versus skutečná hodnota populace v důsledku skutečnosti, že vzorek není pro danou populaci reprezentativní nebo nějakým způsobem zkreslený. Dokonce i náhodně vybrané vzorky budou mít určitou chybu vzorkování, protože jde pouze o aproximaci populace, ze které je odebrána.
Chyby vzorkování lze eliminovat, když se velikost vzorku zvětší, a také zajištěním, že vzorek přiměřeně reprezentuje celou populaci. Předpokládejme například, že společnost XYZ poskytuje službu založenou na předplatném, která spotřebitelům umožňuje platit měsíční poplatek za streamování videí a dalšího programování přes web.
Firma chce zjistit, kdo vlastníci domů sledují alespoň 10 hodin programování přes web každý týden a platit za stávající službu streamování videa. XYZ chce určit, jaké procento populace má zájem o levnou předplacenou službu. Pokud XYZ nemyslí pečlivě o procesu vzorkování, může nastat několik typů vzorkovacích chyb.
Příklady chyb vzorkování
Chyba specifikace populace znamená, že XYZ nerozumí konkrétním typům spotřebitelů, kteří by měli být zařazeni do vzorku. Pokud například XYZ vytvoří populaci lidí ve věku 15 až 25 let, mnoho z těchto spotřebitelů nerozhoduje o nákupu služby streamování videa, protože nepracují na plný úvazek. Na druhou stranu, pokud XYZ sestaví vzorek pracujících dospělých, kteří se rozhodují o nákupu, nemusí spotřebitelé v této skupině sledovat každý týden 10 hodin programování videa.
Chyba výběru také způsobuje zkreslení výsledků vzorku a běžným příkladem je průzkum, který se spoléhá pouze na malou část lidí, kteří okamžitě reagují. Pokud XYZ usiluje o sledování se spotřebiteli, kteří původně neodpovídají, mohou se výsledky průzkumu změnit. Kromě toho, pokud společnost XYZ vyloučí spotřebitele, kteří neodpoví okamžitě, výsledky vzorku nemusí odrážet preference celé populace.
Faktoring ve vzorcích chyb
XYZ se také chce vyhnout chybám, které se netýkají výběru vzorků a které jsou způsobeny lidskou chybou, jako je například chyba při průzkumu. Pokud jedna skupina spotřebitelů sleduje pouze pět hodin programování videa týdně a je zahrnuta do průzkumu, jedná se o chybu, která nebyla vybrána. Dalším typem chyby je kladení otázek, které jsou zkreslené.
