Normální distribuční vzorec je založen na dvou jednoduchých parametrech - střední a standardní odchylce - které kvantifikují charakteristiky daného datového souboru. Zatímco průměr označuje „centrální“ nebo průměrnou hodnotu celého souboru údajů, standardní odchylka označuje „rozprostření“ nebo změnu datových bodů kolem této střední hodnoty.
Zvažte následující 2 datové sady:
Datová sada 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Datový soubor 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Pro dataset1 průměr = 10 a směrodatná odchylka (stddev) = 0
Pro dataset2 průměr = 10 a směrodatná odchylka (stddev) = 2, 83
Podívejme se na tyto hodnoty pro DataSet1:
Podobně pro DataSet2:
Červená vodorovná čára v obou výše uvedených grafech označuje „střední“ nebo průměrnou hodnotu každého souboru dat (10 v obou případech). Růžové šipky ve druhém grafu označují rozptyl nebo odchylku datových hodnot od střední hodnoty. Jedná se o standardní směrodatnou odchylku 2, 83 v případě DataSet2. Protože DataSet1 má všechny hodnoty stejné (každá po 10) a žádné variace, hodnota stddev je nula, a proto nejsou použitelné žádné růžové šipky.
Hodnota stddev má několik významných a užitečných charakteristik, které jsou velmi užitečné při analýze dat. Pro normální rozdělení jsou hodnoty dat symetricky rozloženy po obou stranách střední hodnoty. Pro jakýkoli normálně distribuovaný datový soubor vykreslování grafu s stddev na vodorovné ose a ne. datových hodnot na svislé ose se získá následující graf.
Vlastnosti normální distribuce
- Normální křivka je symetrická kolem průměru; průměr je ve středu a rozděluje plochu na dvě poloviny; celková plocha pod křivkou je rovna 1 pro střední = 0 a stdev = 1; rozdělení je zcela popsáno jeho střední hodnotou a stddev
Jak je vidět z výše uvedeného grafu, stddev představuje následující:
- 68, 3% datových hodnot je v rámci 1 standardní odchylky od průměru (-1 až +1) 95, 4% datových hodnot je v rámci 2 směrodatných odchylek od průměru (-2 až +2) 99, 7% datových hodnot je v rámci 3 směrodatných odchylek střední hodnoty (-3 až +3)
Plocha pod křivkou ve tvaru zvonku, když se měří, ukazuje požadovanou pravděpodobnost daného rozsahu:
- menší než X: - např. pravděpodobnost, že hodnoty dat budou menší než 70 větší než X - např. pravděpodobnost, že hodnoty dat budou vyšší než 95 mezi X 1 a X 2 - např. pravděpodobnost datových hodnot mezi 65 a 85
kde X je hodnota zájmu (příklady níže).
Vykreslování a výpočet oblasti není vždy vhodné, protože různé datové sady budou mít různé střední hodnoty a hodnoty stddev. Pro usnadnění jednotné standardní metody pro snadné výpočty a použitelnost na problémy reálného světa byla zavedena standardní konverze na hodnoty Z, které jsou součástí tabulky normální distribuce.
Z = (X - průměr) / stddev, kde X je náhodná proměnná.
V zásadě tato konverze nutí, aby byl průměr a stddev standardizován na 0 a 1, což umožňuje použití standardně definované sady hodnot Z (z tabulky normální distribuce) pro snadné výpočty. Snímek standardní tabulky z-hodnot obsahující hodnoty pravděpodobnosti je následující:
z |
0, 00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0, 0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 011197 |
0, 01595 |
0, 01994 |
… |
0, 1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 055966 |
… |
0, 2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0, 3 |
0, 111791 |
0, 12172 |
0, 12552 |
0, 12930 |
0, 13307 |
0, 13683 |
… |
0, 4 |
0, 1542 |
0, 155910 |
0, 16276 |
0, 166640 |
0, 17003 |
0, 17364 |
… |
0, 5 |
0, 19146 |
0, 19497 |
0, 199847 |
0.20194 |
0, 20540 |
0, 20884 |
… |
0, 6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
… |
0, 7 |
0, 25804 |
0, 26115 |
0, 266424 |
0, 266730 |
0, 27035 |
0, 27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
Chcete-li najít pravděpodobnost související s hodnotou z 0, 239865, nejprve ji zaokrouhlujte na 2 desetinná místa (tj. 0, 24). Poté zkontrolujte, zda jsou v řádcích první 2 číslice (0, 2) a ve sloupci nejmenší číslice (zbývajících 0, 04). To povede k hodnotě 0, 09483.
Úplnou normální distribuční tabulku s přesností až 5 desetinných míst pro hodnoty pravděpodobnosti (včetně těch pro záporné hodnoty) najdete zde.
Podívejme se na příklady skutečného života. Výška jednotlivců ve velké skupině se řídí běžným distribučním vzorcem. Předpokládejme, že máme sadu 100 jedinců, jejichž výšky jsou zaznamenány a průměr a stddev jsou vypočteny na 66 a 6 palců.
Zde je několik ukázkových otázek, na které lze snadno odpovědět pomocí tabulky z-value:
- Jaká je pravděpodobnost, že osoba ve skupině je 70 palců nebo méně?
Otázka je najít kumulativní hodnotu P (X <= 70), tj. V celém datovém souboru 100, kolik hodnot bude mezi 0 a 70.
Nejprve převeďte X-hodnotu 70 na ekvivalentní Z-hodnotu.
Z = (X - průměr) / stddev = (70-66) / 6 = 4/6 = 0, 666667 = 0, 67 (zaokrouhleno na 2 desetinná místa)
Nyní musíme najít P (Z <= 0, 67) = 0, 24857 (z výše uvedené tabulky z)
tj. existuje 24, 857% pravděpodobnost, že jednotlivec ve skupině bude menší nebo roven 70 palcům.
Ale vydrž - výše uvedené je neúplné. Pamatujte, že hledáme pravděpodobnost všech možných výšek až do 70, tj. Od 0 do 70. Výše uvedené vám pouze dává část od střední k požadované hodnotě (tj. 66 až 70). Abychom dosáhli správné odpovědi, musíme přidat druhou polovinu - od 0 do 66 -.
Protože 0 až 66 představuje poloviční část (tj. Jeden extrémní až střední průměr), je jeho pravděpodobnost jednoduše 0, 5.
Správná pravděpodobnost toho, že osoba bude 70 palců nebo méně = 0, 244857 + 0, 5 = 0, 74857 = 74, 857%
Graficky (výpočtem plochy) jsou to dva součtové oblasti představující řešení:
- Jaká je pravděpodobnost, že osoba je 75 palců nebo vyšší?
tj. najděte doplňkový kumulativní P (X> = 75).
Z = (X - průměr) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Jaká je pravděpodobnost, že osoba bude mezi 52 palci a 67 palci?
Najděte P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) -P (Z <= -0, 233) = (0, 5 + 0, 56749) - (0, 40905) =
Tato normální distribuční tabulka (a hodnoty z) běžně najde použití pro všechny výpočty pravděpodobnosti očekávaných cenových pohybů na akciovém trhu pro akcie a indexy. Používají se při obchodování na základě rozsahu, při identifikaci uptrendu nebo downtrendu, úrovně podpory nebo odporu a dalších technických ukazatelů založených na normálních distribučních koncepcích střední a standardní odchylky.
Porovnání investičních účtů × Nabídky, které se objevují v této tabulce, pocházejí od partnerství, od nichž Investopedia dostává náhradu. Název poskytovatele PopisSouvisející články
Základní obchodní obchodování
Testování hypotéz ve financích: koncept a příklady
Řízení rizik
Optimalizujte své portfolio pomocí normální distribuce
Základní technické vzdělání
Lineární regrese času a ceny
Řízení rizik
Použití a limity volatility
Finanční analýza
Jak vypočítat Value at Risk (VaR) v Excelu
Nástroje pro základní analýzu
Porozumění měření volatility
Odkazy na partnerySouvisející termíny
Definice intervalu spolehlivosti Interval spolehlivosti ve statistikách označuje pravděpodobnost, že parametr populace klesne mezi dvě nastavené hodnoty. více Řízení rizik ve financích Ve finančním světě je řízení rizik procesem identifikace, analýzy a přijímání nebo zmírňování nejistoty v investičních rozhodnutích. Řízení rizik nastává kdykoli investor nebo správce fondu analyzuje a pokouší se kvantifikovat potenciál ztrát v investici. více Pochopení úrokové křivky spotové sazby Křivka pokladní úrokové sazby je definována jako výnosová křivka konstruovaná pomocí spotových úrokových sazeb Treasury místo výnosů. Křivka spotové sazby státní pokladny může být použita jako měřítko pro oceňování dluhopisů. více Definice Giniho indexu Giniho index je statistická míra distribuce, která se často používá jako měřítko ekonomické nerovnosti. více Model stanovení cen kapitálových aktiv (CAPM) Model stanovení cen kapitálových aktiv je model, který popisuje vztah mezi rizikem a očekávaným výnosem. více Pochopení harmonického průměru Harmonický průměr je průměr, který se používá ve financích na průměrné násobky, jako je poměr cena / výnos. více