Co je falešná korelace
Ve statistice falešná korelace nebo falešnost odkazuje na spojení mezi dvěma proměnnými, které se jeví příčinné, ale není. Rušné vztahy mají často vzhled jedné proměnné ovlivňující druhou. Tato falešná korelace je často způsobena třetím faktorem, který není zřejmý v době vyšetření, někdy nazývaný matoucím faktorem.
Klíč s sebou
- Zvědavá korelace, nebo zkaženost, je, když se dva faktory zdají být náhodně související, ale nejsou. Vzhled příčinného vztahu je často způsoben podobným pohybem na mapě, který se ukáže jako náhodný nebo způsobený třetím „matoucím“ faktorem. může být často způsobena malými velikostmi vzorků nebo libovolnými koncovými body.
Jak Falešná korelace funguje
Když se dvě náhodné proměnné navzájem úzce sledují v grafu, lze snadno předpokládat korelaci nebo vztah mezi těmito dvěma faktory, kde změna ovlivňuje ostatní. Kromě jiného „příčinného vztahu“ může toto pozorování vést čtenáře grafu k přesvědčení, že pohyb proměnné A je spojen s pohybem v proměnné B nebo naopak. ale někdy, při bližším statistickém zkoumání, zarovnané pohyby jsou náhodné nebo způsobené třetím faktorem, který ovlivňuje první dva. To je falešná korelace. Výzkum prováděný s malými velikostmi vzorků nebo libovolnými cílovými parametry je zvláštnost, která může podléhat falešnosti.
Příklad rušivých korelací
Není příliš náročné objevovat zajímavé korelace. Mnohé se však ukáží jako falešné. Pokud jde o samce na Wall Street, zahrnují dva populární falešné korelace ženy a sport. Teprve ve dvacátých letech 20. století je teorie délky sukně, která tvrdí, že délky sukně a směr akciového trhu jsou v korelaci. Pokud jsou sukně dlouhé, znamená to, že akciový trh klesá; pokud jsou krátké, trh stoupá. Kolem konce ledna se mluví o takzvaném ukazateli Super Bowl, který naznačuje, že vítězství týmu AFC pravděpodobně znamená, že akciový trh v příštím roce klesne, zatímco vítězství týmu NFC předznamená nárůst trh. Od roku 1966 má ukazatel přesnost 80%. Je to zábavná konverzace, ale pravděpodobně to není něco, co by seriózní finanční poradce doporučil jako investiční strategii pro klienty.
Zde je několik dalších příkladů běžné falešné korelace:
- Když se prodej zmrzliny zvýší, topí se. Může se zdát, že zvýšený prodej zmrzliny způsobuje více utopení, ale ve skutečnosti může stoupající teplo způsobit, že více lidí bude plavat, a také si koupí více zmrzliny. Míra vraždy v USA v letech 2006–2011 klesla stejným tempem jako Microsoft Internet Explorer použití.Exekutoři, kteří říkají, prosím a děkuji, si častěji užívají lepší sdílení výkonu. Lidé, kteří nosí výstroj týmu Oakland Raiders, se častěji dopouštějí trestných činů.
Jak najít falešné korelace
Statistici a další vědci, kteří analyzují data, musí neustále hledat falešné vztahy. Existuje mnoho metod, které používají, včetně:
- Zajištění správného reprezentativního vzorku.Získání přiměřené velikosti vzorku.Při pozornosti libovolných koncových bodů.Kontrolace co nejvíce vnějších proměnných, jak je to možné.Použití nulové hypotézy a kontrola silné p-hodnoty.
