Co je empirické pravidlo?
Empirické pravidlo, také označované jako pravidlo tří sigma nebo pravidlo 68-95-99.7, je statistické pravidlo, které uvádí, že pro normální rozdělení spadají téměř všechna data do tří směrodatných odchylek (označených σ) střední hodnoty (označeno µ). Zlomené empirické pravidlo ukazuje, že 68% spadá do první standardní odchylky (µ ± σ), 95% v rámci prvních dvou směrodatných odchylek (µ ± 2σ) a 99, 7% v rámci prvních tří směrodatných odchylek (µ ± 3σ).
Empirické pravidlo
Pochopení empirického pravidla
Empirické pravidlo se často používá ve statistice pro předpovídání konečných výsledků. Po výpočtu směrodatné odchylky a před shromážděním přesných dat lze toto pravidlo použít jako hrubý odhad výsledku nastávajících dat. Tuto pravděpodobnost lze prozatím využít, protože shromažďování příslušných údajů může být časově náročné nebo dokonce nemožné. Empirické pravidlo se také používá jako hrubý způsob, jak otestovat „normálnost“ distribuce. Pokud příliš mnoho datových bodů spadne mimo hranice tří standardních odchylek, naznačuje to, že rozdělení není normální.
Klíč s sebou
- Empirické pravidlo uvádí, že téměř všechna data leží ve 3 směrodatných odchylkách od průměru pro normální rozdělení. Podle tohoto pravidla spadá 68% dat do jedné směrodatné odchylky. Devadesát pět procent údajů leží ve dvou směrodatných odchylkách. tři standardní odchylky jsou 99, 7% dat.
Příklady empirického pravidla
Předpokládejme, že populace zvířat v zoo je známa jako obvykle distribuovaná. Průměrná délka života každého zvířete je 13, 1 let a standardní odchylka délky života je 1, 5 roku. Pokud chce někdo znát pravděpodobnost, že zvíře bude žít déle než 14, 6 let, může použít empirické pravidlo. Znát průměr distribuce je 13, 1 roků starý, následující věková rozpětí se vyskytují pro každou standardní odchylku:
- Jedna směrodatná odchylka (µ ± σ): (13, 1 - 1, 5) až (13, 1 + 1, 5) nebo 11, 6 až 14, 6 Dvě standardní odchylky (µ ± 2σ): 13, 1 - (2 x 1, 5) až 13, 1 + (2 x 1, 5), nebo 10, 1 až 16, 1 Tři standardní odchylky (µ ± 3σ): 13, 1 - (3 x 1, 5) až 13, 1 + (3 x 1, 5), nebo 8, 6 až 17, 6
Osoba řešící tento problém musí vypočítat celkovou pravděpodobnost, že zvíře žije 14, 6 let nebo déle. Empirické pravidlo ukazuje, že 68% distribuce leží v jedné standardní odchylce, v tomto případě od 11, 6 do 14, 6 let. Zbývajících 32% distribuce tedy leží mimo tento rozsah. Polovina leží nad 14, 6 a polovina leží pod 11, 6. Pravděpodobnost, že zvíře žije déle než 14, 6, je tedy 16% (počítáno jako 32% děleno dvěma).
Jako další příklad lze předpokládat, že zvíře v zoo žije v průměru do 10 let se standardní odchylkou 1, 4 roku. Předpokládejme, že se zookeeper snaží zjistit pravděpodobnost, že zvíře žije déle než 7, 2 roku. Tato distribuce vypadá následovně:
- Jedna směrodatná odchylka (µ ± σ): 8, 6 až 11, 4 let Dvě standardní odchylky (µ ± 2σ): 7, 2 až 12, 8 let Tři standardní odchylky ((± ± 3σ): 5, 8 až 14, 2 let
Empirické pravidlo uvádí, že 95% distribuce leží ve dvou směrodatných odchylkách. 5% leží mimo dvě standardní odchylky; polovina nad 12, 8 let a polovina pod 7, 2 roku. Pravděpodobnost života déle než 7, 2 roku je tedy:
95% + (5% / 2) = 97, 5%
