Co je vícenásobná lineární regrese - MLR?
Vícenásobná lineární regrese (MLR), také známá jednoduše jako vícenásobná regrese, je statistická technika, která používá několik vysvětlujících proměnných k predikci výsledku proměnné odpovědi. Cílem vícenásobné lineární regrese (MLR) je modelovat lineární vztah mezi vysvětlujícími (nezávislými) proměnnými a odezvou (závislou) proměnnou.
V podstatě je vícenásobná regrese rozšířením běžné regrese nejmenších čtverců (OLS), která zahrnuje více než jednu vysvětlující proměnnou.
Vzorec pro vícenásobnou lineární regresi je
Cvičení Yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵ, kde i = n pozorování: yi = závislá proměnná xi = expanzivní proměnnéβ0 = y-zastavení (konstanta) termín) βp = koeficienty sklonu pro každou vysvětlující proměnnouϵ = chybový termín modelu (známý také jako zbytky)
Vysvětlení vícenásobné lineární regrese
Jednoduchá lineární regrese je funkce, která umožňuje analytikovi nebo statistikovi vytvářet předpovědi o jedné proměnné na základě informací, které jsou známy o jiné proměnné. Lineární regrese lze použít pouze tehdy, má-li jedna souvislá proměnná - nezávislá a závislá proměnná. Nezávislá proměnná je parametr, který se používá pro výpočet závislé proměnné nebo výsledku. Vícenásobný regresní model zahrnuje několik vysvětlujících proměnných.
Model vícenásobné regrese je založen na následujících předpokladech:
- Mezi závislými proměnnými a nezávislými proměnnými existuje lineární vztah. Nezávislé proměnné nejsou navzájem příliš korelované. Pozorování jsou vybírána nezávisle a náhodně z populace. Zbytky by měly být normálně distribuovány s průměrem 0 a rozptylem. σ.
Koeficient determinace (na druhou mocninu) je statistická metrika, která se používá k měření toho, jak velkou odchylku ve výsledku lze vysvětlit změnou nezávislých proměnných. R2 se vždy zvyšuje, když je do MLR modelu přidáno více prediktorů, i když prediktory nemusí souviset s výslednou proměnnou.
Samotný R2 tedy nemůže být použit k identifikaci, které prediktory by měly být zahrnuty do modelu a které by měly být vyloučeny. R2 může být pouze mezi 0 a 1, kde 0 znamená, že výsledek nemůže být předpovídán žádnou z nezávislých proměnných a 1 označuje, že výsledek může být předpovídán bez chyby z nezávislých proměnných.
Při interpretaci výsledků vícenásobné regrese jsou beta koeficienty platné, zatímco všechny ostatní proměnné zůstávají konstantní („všechny ostatní jsou stejné“). Výstup z vícenásobné regrese lze zobrazit vodorovně jako rovnici nebo svisle ve formě tabulky.
Příklad použití vícenásobné lineární regrese
Například analytik může chtít vědět, jak pohyb trhu ovlivňuje cenu Exxon Mobil (XOM). V tomto případě bude mít jeho lineární rovnice hodnotu indexu S&P 500 jako nezávislou proměnnou nebo prediktorem a cenu XOM jako závislou proměnnou.
Ve skutečnosti existuje mnoho faktorů, které předpovídají výsledek události. Například pohyb cen Exxon Mobil závisí více než jen na výkonu celého trhu. Další prediktory, jako je cena ropy, úrokové sazby a cenový pohyb ropných futures, mohou ovlivnit cenu XOM a ceny akcií jiných ropných společností. K pochopení vztahu, ve kterém jsou přítomny více než dvě proměnné, se používá vícenásobná lineární regrese.
Vícenásobná lineární regrese (MLR) se používá k určení matematického vztahu mezi množstvím náhodných proměnných. Jinými slovy MLR zkoumá, jak více nezávislých proměnných souvisí s jednou závislou proměnnou. Jakmile je každý z nezávislých faktorů určen k predikci závislé proměnné, lze informace o více proměnných použít k vytvoření přesné predikce úrovně účinku, který mají na výslednou proměnnou. Model vytváří vztah ve formě přímky (lineární), která nejlépe aproximuje všechny jednotlivé datové body.
S odkazem na MLR rovnici výše, v našem příkladu:
- y i = závislá proměnná: cena XOMx i1 = úrokové sazby x i2 = cena ropy x i3 = hodnota S&P 500 indexx i4 = cena ropných futuresB 0 = y-přestávka v čase nula B 1 = regresní koeficient, který měří změnu jednotky v závislé proměnná při změně x i1 - změna ceny XOM při změně úrokových sazebB 2 = hodnota koeficientu, která měří jednotkovou změnu závislé proměnné při změně x i2 - změna ceny XOM při změně ceny ropy
Odhady nejmenších čtverců, Bo, Bi, B2… Bp, jsou obvykle počítány statistickým softwarem. Do regresního modelu může být zahrnuto mnoho proměnných, ve kterých je každá nezávislá proměnná diferencována číslem - 1, 2, 3, 4… p. Model vícenásobné regrese umožňuje analytikům předpovídat výsledek na základě informací poskytnutých o více vysvětlujících proměnných.
Model však není vždy dokonale přesný, protože každý datový bod se může mírně lišit od výsledku předpovídaného modelem. Zbytková hodnota E, což je rozdíl mezi skutečným a předpokládaným výsledkem, je zahrnuta do modelu, aby se zohlednily takové malé odchylky.
Za předpokladu, že spustíme náš regresní model XOM cen pomocí softwaru pro výpočet statistiky, který vrací tento výstup:
Analytik by interpretoval tento výstup tak, že pokud budou jiné proměnné drženy konstantní, cena XOM vzroste o 7, 8%, pokud cena ropy na trzích vzroste o 1%. Model také ukazuje, že cena XOM se po zvýšení úrokových sazeb o 1% sníží o 1, 5%. R2 znamená, že 86, 5% z cen akcií společnosti Exxon Mobil lze vysvětlit změnami úrokové sazby, ceny ropy, futures na ropu a indexu S&P 500.
Klíč s sebou
- Vícenásobná lineární regrese (MLR), také známá jednoduše jako vícenásobná regrese, je statistická technika, která používá několik vysvětlujících proměnných k predikci výsledku proměnné odezvy. MLR je široce používán v ekonometrii a finanční inference.
Rozdíl mezi lineární a vícenásobnou regresí
Lineární (OLS) regrese porovnává odpověď závislé proměnné na změnu některé vysvětlující proměnné. Je však vzácné, že závislá proměnná je vysvětlena pouze jednou proměnnou. V tomto případě analytik používá vícenásobnou regresi, která se pokouší vysvětlit závislou proměnnou pomocí více než jedné nezávislé proměnné. Více regresí může být lineární a nelineární.
Více regresí je založeno na předpokladu, že existuje lineární vztah mezi závislými i nezávislými proměnnými. Rovněž nepředpokládá žádnou větší korelaci mezi nezávislými proměnnými.
