Co je multicollinearity?
Multicollinearity je výskyt vysokých vzájemných korelací mezi nezávislými proměnnými v modelu vícenásobné regrese. Multicollinearity může vést ke zkresleným nebo zavádějícím výsledkům, když se výzkumník nebo analytik pokusí určit, jak dobře lze každou nezávislou proměnnou použít nejúčinněji k predikci nebo porozumění závislé proměnné ve statistickém modelu. Obecně může multikoloinearita vést k širším intervalům spolehlivosti a méně spolehlivým hodnotám pravděpodobnosti pro nezávislé proměnné. To znamená, že statistické závěry z modelu s vícebarevností nemusí být spolehlivé.
Porozumění vícebarevnosti
Statističtí analytici používají několik regresních modelů k predikci hodnoty určité závislé proměnné na základě hodnot dvou nebo více nezávislých proměnných. Závislá proměnná se někdy označuje jako proměnná výsledku, cíle nebo kritéria. Příkladem je mnohorozměrný regresní model, který se pokouší předvídat návratnost zásob na základě položek, jako je poměr ceny k výdělku, tržní kapitalizace, minulá výkonnost nebo jiná data. Návratnost akcií je závislá proměnná a různé bity finančních údajů jsou nezávislé proměnné.
Klíč s sebou
- Multicollinearity je statistický koncept, ve kterém jsou nezávislé proměnné v modelu korelovány. Vícekultinearita mezi nezávislými proměnnými bude mít za následek méně spolehlivé statistické závěry. Je lepší použít nezávislé proměnné, které nesouvisejí nebo se opakují, když se buduje více regresních modelů, které používají dvě nebo více proměnných.
Multicollinearity v modelu vícenásobné regrese naznačuje, že kolineární nezávislé proměnné jsou nějakým způsobem příbuzné, ačkoli vztah může nebo nemusí být náhodný. Například výkonnost v minulosti může souviset s tržní kapitalizací, protože akcie, které si v minulosti vedly dobře, budou mít rostoucí tržní hodnoty. Jinými slovy, multicollinearity může existovat, když jsou dvě nezávislé proměnné vysoce korelovány. Může se také stát, pokud je nezávislá proměnná vypočítána z jiných proměnných v datové sadě nebo pokud dvě nezávislé proměnné poskytují podobné a opakující se výsledky.
Jedním z nejčastějších způsobů, jak eliminovat problém multiklinearity, je nejprve identifikovat kolineární nezávislé proměnné a poté odstranit všechny kromě jedné. Je také možné eliminovat multiklinearitu kombinací dvou nebo více kolineárních proměnných do jedné proměnné. Statistická analýza pak může být provedena za účelem studia vztahu mezi specifikovanou závislou proměnnou a pouze jednou nezávislou proměnnou.
Příklad multicollinearity
Pokud jde o investice, je při provádění technické analýzy běžným hlediskem vícečetnost, která předpovídá pravděpodobné budoucí cenové pohyby cenného papíru, například akcie nebo komoditní budoucnost. Analytici trhu se chtějí vyhnout použití technických ukazatelů, které jsou kolineární v tom, že jsou založeny na velmi podobných nebo souvisejících vstupech; mají sklon odhalit podobné předpovědi týkající se závislé proměnné pohybu cen. Místo toho musí být analýza trhu založena na výrazně odlišných nezávislých proměnných, aby bylo zajištěno, že analyzují trh z různých nezávislých analytických hledisek.
Známý technický analytik John Bollinger, tvůrce ukazatele Bollinger Bands, poznamenává, že „kardinální pravidlo pro úspěšné použití technické analýzy vyžaduje, aby se u indikátorů vyhýbalo multicollinearitě.“
K vyřešení problému se analytici vyhýbají použití dvou nebo více technických ukazatelů stejného typu. Místo toho analyzují zabezpečení pomocí jednoho typu indikátoru, jako je například indikátor hybnosti, a poté provádějí samostatnou analýzu pomocí jiného typu indikátoru, jako je například indikátor trendu.
Příkladem potenciálního problému vícečetnosti je provádění technické analýzy pouze pomocí několika podobných ukazatelů, jako jsou stochastické údaje, index relativní pevnosti (RSI) a Williams% R, což jsou všechny ukazatele hybnosti, které se spoléhají na podobné vstupy a pravděpodobně budou produkovat podobné Výsledek. V tomto případě je lepší odstranit všechny indikátory kromě jednoho nebo najít způsob, jak sloučit několik z nich do jediného indikátoru, a také přidat indikátor trendu, který pravděpodobně nebude vysoce korelován s indikátorem hybnosti.
