Co je zanedbávání velikosti vzorku?
Zanedbání velikosti vzorku je kognitivní zaujatost, kterou skvěle studovali Amos Tversky a Daniel Kahneman. K tomu dochází, když uživatelé statistických informací učiní nesprávné závěry tím, že nezohlední velikost vzorku dotyčných údajů.
Základní příčinou zanedbávání velikosti vzorku je to, že lidé často nechápou, že u malých vzorků je pravděpodobnější vysoká úroveň rozptylu. Proto je důležité určit, zda velikost vzorku použitá k vytvoření dané statistiky je dostatečně velká, aby umožnila smysluplné závěry.
Vědět, kdy je velikost vzorku dostatečně velká, může být náročné pro ty, kteří nemají dobré znalosti statistických metod.
Klíč s sebou
- Zanedbání velikosti vzorku je kognitivní zkreslení, které studovali Amos Tversky a Daniel Kahneman. Sestává z toho, že ze statistických informací vycházíme z nepravdivých závěrů, protože se nezohlednily účinky velikosti vzorku. velikosti vzorků jsou spojeny s volatilnějšími statistickými výsledky a naopak.
Pochopení zanedbání velikosti vzorku
Pokud je velikost vzorku příliš malá, nelze vyvodit přesné a důvěryhodné závěry. V kontextu financí to může investory zavádět různými způsoby.
Například, investor by mohl vidět nový investiční fond, který se může pochlubit generováním 15% anualizovaných výnosů od svého založení. Investor by mohl rychle zahrnout, že tento fond je jejich vstupenkou na rychlou tvorbu bohatství. Tento závěr by však mohl být nebezpečně zavádějící, pokud by fond příliš dlouho neinvestoval. V takovém případě by mohly být výsledky způsobeny krátkodobými anomáliemi a nemusí mít nic společného se skutečnou investiční metodikou fondu.
Zanedbávání velikosti vzorku je často zaměňováno s zanedbáváním základní sazby, což je samostatná kognitivní předpojatost. Zatímco zanedbávání velikosti vzorku odkazuje na nezohlednění úlohy velikosti vzorku při určování důvěryhodnosti statistických požadavků, zanedbávání základní sazby souvisí s tendencí lidí zanedbávat stávající znalosti o jevu při hodnocení nových informací.
Příklad zanedbání velikosti vzorku v reálném světě
Chcete-li lépe porozumět zanedbávání velikosti vzorku, zvažte následující příklad, který vychází z výzkumu Amose Tverského a Daniela Kahnemana:
Osoba je požádána, aby čerpala ze vzorku pěti koulí a zjistí, že čtyři jsou červené a jeden zelený.
Člověk čerpá ze vzorku 20 koulí a zjistí, že 12 je červených a osm je zelených.
Který vzorek poskytuje lepší důkaz, že koule jsou převážně červené?
Většina lidí tvrdí, že první menší vzorek poskytuje mnohem silnější důkazy, protože poměr červené a zelené je mnohem vyšší než větší vzorek. Ve skutečnosti je však vyšší poměr vyvážen menší velikostí vzorku. Vzorek 20 skutečně poskytuje mnohem silnější důkazy.
Další příklad od Amos Tversky a Daniel Kahneman je následující:
Město je obsluhováno dvěma nemocnicemi. Ve větší nemocnici se každý den narodí v průměru 45 dětí a v menší nemocnici se každý den narodí asi 15 dětí. Ačkoli 50% všech dětí jsou chlapci, přesné procento kolísá ze dne na den.
Během jednoho roku každá nemocnice zaznamenala dny, ve kterých více než 60% dětí bylo náhodou chlapců. Která nemocnice zaznamenala více takových dnů?
Při dotazu na tuto otázku 22% respondentů uvedlo, že větší nemocnice uvede více takových dnů, zatímco 56% uvedlo, že výsledky budou stejné pro obě nemocnice. Ve skutečnosti je správná odpověď, že menší nemocnice by zaznamenala více takových dnů, protože její menší velikost by vyvolala větší variabilitu.
Jak jsme již dříve poznamenali, kořen zanedbávání velikosti vzorku je ten, že lidé často nechápou, že u malých vzorků se častěji vyskytují vysoké úrovně rozptylu. Při investování to může být opravdu velmi nákladné.
