Co je faktor inflace?
Inflační variance fVariance inflační faktor (VIF) je míra množství multicollinearity v sadě více regresních proměnných. Matematicky je VIF pro proměnnou regresního modelu rovna poměru celkového rozptylu modelu k rozptylu modelu, který zahrnuje pouze jednu samostatnou proměnnou. Tento poměr se počítá pro každou nezávislou proměnnou. Vysoký VIF označuje, že přidružená nezávislá proměnná je vysoce kolineární s ostatními proměnnými v modelu.
Klíč s sebou
- Faktor rozptylového inflace (VIF) poskytuje měřítko multicollinearity mezi nezávislými proměnnými v modelu vícenásobné regrese. Detekce multicollinearity je důležitá, protože zatímco nesnižuje vysvětlující sílu modelu, snižuje statistickou významnost nezávislých proměnných. Velký VIF na nezávislé proměnné označuje vysoce kolineární vztah k ostatním proměnným, které by měly být zváženy nebo upraveny ve struktuře modelu a výběru nezávislých proměnných.
Porozumění faktoru inflace variace
Vícečetná regrese se používá, když člověk chce otestovat vliv více proměnných na konkrétní výsledek. Závislá proměnná je výsledek, který je ovlivňován nezávislými proměnnými, které jsou vstupy do modelu. Multicollinearity existuje, když existuje lineární vztah nebo korelace mezi jednou nebo více nezávislými proměnnými nebo vstupy. Multicollinearity vytváří problém v vícenásobné regresi, protože protože všechny vstupy se navzájem ovlivňují, nejsou ve skutečnosti nezávislé a je obtížné otestovat, jak kombinace nezávislých proměnných ovlivňuje závislou proměnnou nebo výsledek v rámci regresního modelu.. Ve statistickém vyjádření, model vícenásobné regrese, kde je vysoká multicollinearita, ztěžuje odhad vztahu mezi každou z nezávislých proměnných a závislou proměnnou. Malé změny v použitých datech nebo ve struktuře modelové rovnice mohou způsobit velké a nevyrovnané změny v odhadovaných koeficientech nezávislých proměnných.
Aby bylo zajištěno, že model je správně specifikován a funguje správně, existují testy, které mohou být spuštěny pro multicollinearity. Jedním z takových měřících nástrojů je faktor inflace. Použití faktorů rozptylu inflace pomáhá určit závažnost jakýchkoli problémů s vícečetností, aby bylo možné model upravit. Variační inflační faktor měří, do jaké míry je chování (variance) nezávislé proměnné ovlivněno nebo nafouknuto její interakcí / korelací s ostatními nezávislými proměnnými. Faktory inflace kolísání umožňují rychlé měření toho, do jaké míry proměnná přispívá ke standardní chybě v regresi. Pokud existují významné problémy s vícečetností, bude rozptylný inflační faktor pro dané proměnné velmi velký. Poté, co jsou tyto proměnné identifikovány, lze použít několik přístupů k eliminaci nebo kombinaci kolineárních proměnných, čímž se vyřeší problém multikolearnosti.
Zatímco multikoloinearita nesnižuje celkovou predikční sílu modelu, může vytvářet odhady regresních koeficientů, které nejsou statisticky významné. V jistém smyslu to lze v modelu považovat za jakési dvojí počítání. Pokud jsou dvě nebo více nezávislých proměnných úzce spjaty nebo měří téměř to samé, pak se základní účinek, který měří, započítává dvakrát (nebo více) napříč proměnnými a je obtížné nebo nemožné říci, která proměnná skutečně ovlivňuje nezávislé proměnné. To je problém, protože cílem mnoha ekonometrických modelů je přesně otestovat tento druh statistického vztahu mezi nezávislými proměnnými a závislými proměnnými.
Například, pokud chce ekonom vyzkoušet, zda existuje statisticky významný vztah mezi mírou nezaměstnanosti (jako nezávislá proměnná) a mírou inflace (jako závislá proměnná). Zahrnutí dalších nezávislých proměnných, které souvisejí s mírou nezaměstnanosti, jako jsou nové počáteční nároky na nezaměstnané, by do modelu pravděpodobně zavedlo multicollinearitu. Celkový model by mohl vykazovat silnou, statisticky dostatečnou vysvětlující sílu, ale nemohl by zjistit, zda je tento účinek způsoben většinou nezaměstnaností nebo novými počátečními nároky na nezaměstnané. To by VIF zjistil a navrhl by se, že by se některá z proměnných vynechala z modelu nebo by se našel nějaký způsob, jak je konsolidovat, aby se zachytil jejich společný účinek, v závislosti na konkrétní hypotéze, kterou výzkumník má zájem o testování.
