Co je to Winsorized Mean?
Winsorizovaný průměr je metoda průměrování, která zpočátku nahrazuje nejmenší a největší hodnoty pozorováním nejblíže k nim. To se provádí za účelem omezení účinku abnormálních extrémních hodnot nebo odlehlých hodnot na výpočet. Po nahrazení hodnot se použije aritmetický průměr pro výpočet winsorizovaného průměru.
Vzorec pro Winsorized Mean Is
Cvičení Winsorized Mean = Nxn… xn + 1 + xn + 2… xn kde: n = počet největších a nejmenších datových bodů, které mají být nahrazeny pozorováním
Vinsorizované prostředky jsou vyjádřeny dvěma způsoby. Winsorizovaný průměr „k n “ označuje nahrazení nejmenších a největších pozorování 'k', kde 'k' je celé číslo. "X%" winsorizovaný průměr zahrnuje nahrazení daného procenta hodnot z obou konců dat.
Jak spočítat Winsorized Mean
Vítězný průměr se vypočítá nahrazením nejmenších a největších datových bodů, sčítáním všech datových bodů a vydělením součtu celkovým počtem datových bodů.
Co vám říká Winsorized Mean?
Winsorizovaný průměr je méně citlivý na odlehlé hodnoty, protože je může nahradit méně extrémními hodnotami. To znamená, že je méně citlivé na obrysy versus průměr. Pokud však má distribuce tukové ocasy, účinek odstranění nejvyšší a nejnižší hodnoty v distribuci bude mít malý vliv kvůli vysokému počtu proměnlivosti v distribučních číslech.
Klíč s sebou
- Metoda průměrování, která zahrnuje nahrazení nejmenších a největších hodnot pozorováním nejblíže k nim. Méně citlivá na odlehlé hodnoty, protože je může nahradit méně extrémními hodnotami. Je to na rozdíl od oříznutého průměru, který zahrnuje odstranění datových bodů - i když je výsledek dvou bývají blízko.
Příklad použití Winsorized Mean
Je možné vypočítat winsorizovaný průměr pro následující sadu dat: 1, 5, 7, 8, 9, 10, 14. V tomto příkladu předpokládáme, že winsorizovaný průměr je v prvním pořadí, nahradíme nejmenší a největší hodnoty jejich nejbližší pozorování.
Datový soubor se nyní objevuje takto: 5, 5, 7, 8, 9, 10, 10. Při použití aritmetického průměru nové sady se získá winsorizovaný průměr 7, 7 nebo (5 + 5 + 7 + 8 + 9 + 10 + 10) děleno 7.
Nebo zvažte 20% winsorized průměr, který vezme horní 10% a dolní 10% a nahradí je jejich nejbližší nejbližší hodnotou. Budeme winsorize následující soubor dat: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Oba nejmenší a největší datové body, nebo 10%, budou nahrazeny jejich nejbližší nejbližší hodnotou. Nový soubor dat je tedy: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61, 61. Winsorized průměr je 33, 9, nebo součet dat (678) vydělený celkovým počtem datových bodů (20).
Rozdíl mezi Winsorized Mean a Trimmed Mean
Vítězný průměr zahrnuje úpravu datových bodů, zatímco oříznutý průměr zahrnuje odstranění datových bodů. Je obvyklé, že winsorizovaný průměr a zkrácený průměr jsou blízko.
Omezení použití Winsorized Mean
Jednou z hlavních nevýhod pro winsorizované prostředky je to, že zavádějí zkreslení do datové sady. Je pravda, že datová sada je po úpravě ideálně méně zaujatá, než kdyby v ní zůstaly odlehlé hodnoty.
Další informace o Winsorized Mean
Pro související informace o rozdílech mezi klíčovými průměrnými výpočty.
