Variance je měření rozpětí mezi čísly v sadě dat. Rozptyl měří, jak daleko je každé číslo v sadě od střední hodnoty.
Pomocí grafu datových sad můžeme sledovat, jaký je lineární vztah různých datových bodů nebo čísel. Děláme to tak, že nakreslíme regresní linii, která se snaží minimalizovat vzdálenost každého jednotlivého datového bodu od samotné linie. V níže uvedeném grafu jsou datové body modré tečky, oranžová čára je regresní čára a červené šipky jsou vzdálenost od pozorovaných dat a regresní čáry.
Obrázek Julie Bang © Investopedia 2020
Když počítáme rozptyl, ptáme se, vzhledem k vztahu všech těchto datových bodů, jakou vzdálenost očekáváme v dalším datovém bodu? Tato „vzdálenost“ se nazývá chybový termín a měří se rozptyl.
Samotná variance není často užitečná, protože nemá jednotku, což ztěžuje měření a porovnávání. Druhá odmocnina rozptylu je však standardní odchylkou, a to je praktické jako měření.
Výpočet odchylky v Excelu
Vypočítání rozptylu v Excelu je snadné, pokud již máte sadu dat do softwaru. V níže uvedeném příkladu vypočítáme rozptyl 20denních denních výnosů ve vysoce populárním burzovním fondu (ETF) s názvem SPY, který investuje do S&P 500.
- Vzorec je = VAR.S (vyberte data)
Důvod, proč chcete používat VAR.S a ne VAR.P (což je další nabízený vzorec), je ten, že často nemáte celou populaci dat k měření. Například, pokud bychom měli všechny návraty v historii SPY ETF v naší tabulce, mohli bychom použít měření populace VAR.P, ale protože pro měření konceptu měříme pouze posledních 20 dní, použijeme VAR.S.
Jak vidíte, vypočtená hodnota rozptylu 0, 000018674 nám sama o sobě jen málo říká o sadě dat. Pokud bychom šli do druhé odmocniny této hodnoty a dostali jsme standardní odchylku výnosů, bylo by to užitečnější.
