Co je chyba bez vzorkování?
Chyba bez vzorkování je statistický pojem, který se vztahuje k chybě, ke které dochází během sběru dat, což způsobuje, že se data liší od skutečných hodnot. Chyba bez vzorkování se liší od chyby vzorkování. Chyba vzorkování je omezena na jakékoli rozdíly mezi hodnotami vzorků a hodnotami vesmíru, které vznikají, protože velikost vzorku byla omezená. (Celý průzkum nemůže být vzorkován v průzkumu ani sčítání lidu.)
Klíč s sebou
- Chyba bez vzorkování je termín používaný ve statistikách, který odkazuje na chybu, ke které dochází během sběru dat a způsobuje, že se data liší od skutečných hodnot. Chyba bez výběru vzorků se týká náhodných nebo systematických chyb a tyto chyby mohou být obtížné zjistit v průzkumu, vzorku nebo sčítání. Systematické chyby, které se netýkají odběru vzorků, jsou horší než náhodné chyby, které se netýkají odběru vzorků, protože systematické chyby mohou mít za následek vyřazení studie, průzkumu nebo sčítání. Čím vyšší je počet chyb, tím méně spolehlivé informace. Když dojde k chybám bez výběru vzorků, míra zaujatosti ve studii nebo průzkumu stoupá.
Chyba vzorkování může nastat, i když nedojde k žádným chybám. „Chyby“ vyplývají z pouhé skutečnosti, že údaje ve vzorku pravděpodobně nebudou dokonale odpovídat údajům ve vesmíru, ze kterého je vzorek odebrán. Tuto „chybu“ lze minimalizovat zvýšením velikosti vzorku.
Chyby bez výběru vzorků pokrývají všechny ostatní nesrovnalosti, včetně těch, které vyplývají ze špatné techniky odběru vzorků.
Jak funguje chyba bez vzorkování
Ve vzorcích i sčítáních, ve kterých je sledována celá populace, se mohou vyskytnout chyby, které se netýkají výběru vzorků. Chyby bez výběru vzorků spadají do dvou kategorií: náhodné a systematické.
Předpokládá se, že náhodné chyby se vzájemně vyrovnávají, a proto se nejčastěji netýkají. Na druhé straně systematické chyby ovlivňují celý vzorek, a proto představují závažnější problém. Náhodné chyby obecně nepovedou k sešrotování vzorku nebo sčítání, zatímco systematická chyba s největší pravděpodobností způsobí, že shromážděná data nebudou použitelná.
Chyby bez výběru vzorků jsou způsobeny spíše vnějšími faktory než problémem v rámci průzkumu, studie nebo sčítání.
Existuje mnoho způsobů, jak se mohou vyskytnout chyby bez vzorkování. Například chyby, které se netýkají výběru vzorků, mohou zahrnovat, ale nejsou na ně omezeny, chyby při zadávání údajů, neobjektivní otázky průzkumu, neobjektivní zpracování / rozhodování, neodpovězení, nevhodné závěry analýzy a nepravdivé informace poskytnuté respondenty.
Zvláštní úvahy
I když zvětšení velikosti vzorku může pomoci minimalizovat chyby při vzorkování, nebude to mít žádný vliv na snižování chyb při odběru vzorků. Důvodem je to, že chyby, které se netýkají výběru vzorků, jsou často obtížné odhalit a je prakticky nemožné je odstranit.
Chyby bez výběru vzorků zahrnují chyby neodpovídající, chyby pokrytí, chyby při rozhovorech a chyby zpracování. K chybě pokrytí by například došlo, pokud by byla osoba v průzkumu započítána dvakrát, nebo kdyby byly její odpovědi v průzkumu duplikovány. Pokud je tazatel při výběru vzorků zaujatý, pak se chyba, která nebyla vybrána, bude považovat za chybu tazatele.
Kromě toho je obtížné prokázat, že respondenti v průzkumu poskytují nepravdivé informace - omylem nebo záměrně. V obou případech se dezinformace poskytované respondenty počítají jako chyby, které se netýkají výběru vzorků, a jsou popsány jako chyby odpovědi.
Technické chyby existují v jiné kategorii. Pokud existují nějaké položky související s daty - například kódování, sběr, záznam nebo úpravy - považují se za chyby zpracování.
