Co je overfitting?
Overfitting je chyba modelování, ke které dochází, když je funkce příliš blízko k omezené sadě datových bodů. Přeplnění modelu má obecně podobu vytvoření příliš složitého modelu, který vysvětluje idiosynkrasie ve studovaných datech.
Ve skutečnosti mají často studovaná data v sobě určitý stupeň chyb nebo náhodného šumu. Pokus o přiblížení modelu příliš těsně k nepřesným údajům může tedy model infikovat podstatnými chybami a snížit jeho prediktivní sílu.
Klíč s sebou
- Overfitting je chyba modelování, ke které dochází, když je funkce příliš těsně přizpůsobena omezenému souboru datových bodů. Finanční profesionálové si musí být vždy vědomi nebezpečí, že model přeplňuje model založený na omezených datech.
Porozumění Overfitting
Například běžným problémem je použití počítačových algoritmů k prohledávání rozsáhlých databází historických tržních dat za účelem nalezení vzorců. Při dostatečném studiu je často možné vyvinout propracované věty, které podle všeho předpovídají věci, jako jsou výnosy na akciovém trhu, s přesnou přesností.
Pokud se však použijí na data mimo vzorek, mohou se tyto věty pravděpodobně ukázat jako pouhé přetvoření modelu na to, co ve skutečnosti bylo jen náhodným výskytem. Ve všech případech je důležité testovat model na datech, která jsou mimo vzorek použitý k jeho vývoji.
Finanční profesionálové si musí být vždy vědomi nebezpečí nadměrného vybavení modelu založeného na omezených datech.
