Co je kvartil?
Kvartil je statistický termín popisující rozdělení pozorování do čtyř definovaných intervalů na základě hodnot dat a jejich porovnání s celou sadou pozorování.
Porozumění kvartilům
Abychom porozuměli kvartilu, je důležité chápat medián jako měřítko centrální tendence. Medián ve statistice je střední hodnota množiny čísel. Je to bod, ve kterém přesně polovina dat leží pod a nad centrální hodnotou.
Takže, vzhledem k sadě 13 čísel, bude medián sedmé číslo. Šest čísel předcházejících této hodnotě jsou nejnižší čísla v datech a šest čísel po mediánu jsou nejvyšší čísla v daném datovém souboru. Protože střední hodnota není ovlivněna extrémními hodnotami nebo odlehlými hodnotami v distribuci, je někdy upřednostňována před střední hodnotou.
Medián je robustní odhadce umístění, ale neříká nic o tom, jak jsou data na jedné nebo druhé straně jeho hodnoty šířena nebo rozptýlena. To je místo, kde kvartil vstoupí. Kvartil měří šíření hodnot nad a pod průměrem rozdělením distribuce do čtyř skupin.
Klíč s sebou
- Kvartil měří šíření hodnot nad a pod průměrem rozdělením distribuce do čtyř skupin. Kvartil rozděluje data do tří bodů - dolní kvartil, medián a horní kvartil, aby vytvořil čtyři skupiny datové sady. Používají se kvartily vypočítat mezikvartilové rozmezí, což je míra variability kolem mediánu.
Jak kvartily fungují
Stejně jako medián rozděluje data na polovinu, takže 50% měření leží pod mediánem a 50% leží nad ním, kvartil rozdělí data na čtvrtiny, takže 25% měření je menší než dolní kvartil, 50 % jsou menší než průměr a 75% jsou nižší než horní kvartil.
Kvartil rozděluje data do tří bodů - dolní kvartil, střední a horní kvartil, aby vytvořily čtyři skupiny datových sad. Dolní kvartil nebo první kvartil se označuje jako Q1 a je prostředním číslem, které spadá mezi nejmenší hodnotu sady dat a střední hodnotu. Druhý kvartil, Q2, je také mediánem. Horní nebo třetí kvartil, označený jako Q3, je středním bodem, který leží mezi střední a nejvyšší hodnotou distribuce.
Nyní můžeme zmapovat čtyři skupiny vytvořené z kvartilů. První skupina hodnot obsahuje nejmenší číslo do Q1; druhá skupina zahrnuje Q1 ke střední hodnotě; třetí sada je střední hodnota pro Q3; čtvrtá kategorie zahrnuje Q3 k nejvyššímu datovému bodu celé sady.
Každý kvartil obsahuje 25% z celkových pozorování. Obecně jsou data uspořádána od nejmenších po největší:
- První kvartil: nejnižší 25% číselSekundární kvartil: mezi 25, 1% a 50% (do střední hodnoty) Třetí kvartil: 51% až 75% (nad střední hodnotou) Čtvrtý kvartil: nejvyšší 25% z čísel
Příklad kvartilu
Pojďme pracovat s příkladem. Předpokládejme, že rozdělení matematických skóre ve třídě 19 studentů ve vzestupném pořadí je:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Nejprve označte medián Q2, což je v tomto případě desátá hodnota: 75.
Q1 je středním bodem mezi nejmenším skóre a středem. V tomto případě Q1 spadá mezi první a páté skóre: 68..
Q3 je střední hodnota mezi Q2 a nejvyšším skóre: 84..
Nyní, když máme naše kvartily, interpretujme jejich počet. Skóre 68 (Q1) představuje první kvartil a je 25. percentil. 68 je střední hodnota spodní poloviny skóre stanoveného v dostupných údajích, tj. Střední hodnota skóre od 59 do 75.
Q1 nám říká, že 25% skóre je méně než 68 a 75% skóre třídy je vyšší. Q2 (medián) je 50. percentil a ukazuje, že 50% skóre je méně než 75 a 50% skóre je nad 75. Nakonec Q3, 75. percentil, ukazuje, že 25% skóre je více a 75% je méně než 84.
Zvláštní úvahy
Pokud je datový bod pro Q1 dále od mediánu než Q3 od mediánu, pak můžeme říci, že mezi menšími hodnotami sady dat je větší rozptyl než mezi většími hodnotami. Stejná logika platí, pokud je Q3 dále od Q2 než Q1 od střední hodnoty.
Alternativně, pokud existuje sudý počet datových bodů, bude medián průměrem středních dvou čísel. V našem příkladu výše, pokud bychom měli 20 studentů místo 19, bude jejich skóre mediánem aritmetického průměru desátého a jedenáctého čísla.
Kvartily se používají k výpočtu mezikvartilového rozmezí, což je míra variability kolem mediánu. Mezikvartilový rozsah se jednoduše vypočítá jako rozdíl mezi prvním a třetím kvartilem: Q3 - Q1. Ve skutečnosti je to rozsah střední poloviny dat, který ukazuje, jak jsou data rozprostřena.
Pro velké sady dat má aplikace Microsoft Excel funkci QUARTILE pro výpočet kvartilů.
