Co je zkreslení výběru vzorku?
Vzorová zkreslení výběru je druh zkreslení způsobený výběrem náhodných dat pro statistickou analýzu. Předpětí existuje kvůli chybě v procesu výběru vzorku, kde je podmnožina dat systematicky vyloučena z důvodu konkrétního atributu. Vyloučení podmnožiny může ovlivnit statistickou významnost testu nebo způsobit zkreslené výsledky.
Pochopení zkreslení výběru vzorku
Předpojatost v přežití je běžný typ zkreslení výběru vzorků. Například při zpětném testování investiční strategie na velké skupině akcií může být vhodné vyhledat cenné papíry, které obsahují data za celé období vzorkování. Pokud bychom měli testovat strategii na základě údajů o zásobách za 15 let, mohli bychom mít sklon hledat zásoby, které mají úplné informace za celé patnáctileté období. Vyloučení akcií, které zastavily obchodování nebo krátce opustily trh, by však do našeho vzorku dat vložilo zkreslení. Protože zahrnujeme pouze akcie, které trvaly 15 let, naše konečné výsledky by byly vadné, protože ty fungovaly dostatečně dobře, aby přežily trh.
Indexy výkonnosti hedžového fondu jsou jedním z příkladů zkreslení výběru vzorků, které podléhají zkreslení přežití. Protože zajišťovací fondy, které nepřežijí, přestanou vykazovat svou výkonnost agregátorům indexů, výsledné indexy jsou přirozeně nakloněny fondům a strategiím, které zůstávají, a proto „přežijí“. To může být problém i u populárních služeb vykazování podílových fondů.
Analytici se mohou přizpůsobit tak, aby zohlednili tato zkreslení, ale mohou do procesu zavést zkreslení zpráv.
