Co je postupná regrese?
Regresní analýza je široce používaný statistický přístup, který se snaží identifikovat vztahy mezi proměnnými. Záměrem je shromáždit relevantní údaje pro přijímání lépe informovaných rozhodnutí a je běžnou praxí ve světě investování. Kroková regrese je postupná iterativní konstrukce regresního modelu, která zahrnuje automatický výběr nezávislých proměnných. Dostupnost statistických softwarových balíčků umožňuje postupnou regresi, dokonce iu modelů se stovkami proměnných.
Druhy postupné regrese
Základním cílem postupné regrese je pomocí řady testů (F-testy, t-testy) najít sadu nezávislých proměnných, které významně ovlivňují závislou proměnnou. To se provádí pomocí počítačů pomocí iterace, což je proces, jak dospět k výsledkům nebo rozhodnutím procházením opakovaných kol nebo cyklů analýzy. Výhodou automatického provádění testů pomocí statistických softwarových balíčků je úspora času pro jednotlivce.
Klíč s sebou
- Regresní analýza je statistický přístup, který se snaží porozumět a měřit vztahy mezi nezávislými a závislými proměnnými. Regresní metoda je metoda, která zkoumá statistickou významnost každé nezávislé proměnné v modelu. Přístup dopředného výběru přidává proměnnou a poté testuje statistickou významnost. Metoda zpětné eliminace začíná modelem naloženým mnoha proměnnými a poté odstraní jednu proměnnou, aby se otestovala její důležitost vzhledem k celkovým výsledkům. Regresní postupnost má mnoho kritiků, protože přístup, který se hodí k datům do modelu k dosažení požadovaného výsledku.
Krokové regrese lze dosáhnout buď vyzkoušením jedné nezávislé proměnné najednou a zahrnutím do regresního modelu, pokud je statisticky významný, nebo zahrnutím všech potenciálních nezávislých proměnných do modelu a vyloučením těch, které nejsou statisticky významné. Někteří používají kombinaci obou metod, a proto existují tři přístupy k postupné regresi:
- Přední výběr začíná v modelu bez proměnných, testuje každou proměnnou, jak je přidávána do modelu, a pak udržuje ty, které jsou považovány za statisticky nejvýznamnější - opakování procesu, dokud nejsou výsledky optimální. Zrychlená eliminace začíná sadou nezávislých proměnných, vymazání jedné po druhé a poté testování, aby se zjistilo, zda je odstraněná proměnná statisticky významná. Obousměrná eliminace je kombinací prvních dvou metod, které testují, které proměnné by měly být zahrnuty nebo vyloučeny.
Příkladem postupné regrese používající metodu zpětné eliminace by byl pokus pochopit spotřebu energie v továrně pomocí proměnných, jako je doba chodu zařízení, věk zařízení, velikost personálu, teploty venku a roční období. Model zahrnuje všechny proměnné - každá z nich se postupně odstraní, aby se určilo, která je nejméně statisticky významná. Nakonec by model mohl ukázat, že roční období a teploty jsou nejvýznamnější, což by mohlo naznačovat, že maximální spotřeba energie v továrně je, když je použití klimatizace na nejvyšší úrovni.
Omezení postupné regrese
Regresní analýza, lineární i multivariační, se dnes v investičním světě široce používá. Cílem je často najít vzory, které existovaly v minulosti a které by se mohly v budoucnu také objevit. Například jednoduchá lineární regrese by se mohla podívat na poměr ceny k výdělku a návratnost zásob po mnoho let a určit, zda akcie s nízkým poměrem P / E (nezávislá proměnná) nabízejí vyšší výnosy (závislá proměnná). Problém tohoto přístupu spočívá v tom, že tržní podmínky se často mění a vztahy, které v minulosti existovaly, nemusí nutně platit v současnosti nebo v budoucnosti.
Mezitím má postupný regresní proces mnoho kritiků a dokonce existují volání, aby se tato metoda úplně nepoužila. Statistici zaznamenávají několik nedostatků v přístupu, včetně nesprávných výsledků, vlastní předpojatosti v samotném procesu a nutnosti značné výpočetní síly pro vývoj komplexních regresních modelů prostřednictvím iterace.
