Co je to populace?
Ve statistice je populace celá skupina, ze které je čerpán statistický vzorek. Populace se může vztahovat na celou skupinu lidí, objektů, událostí, návštěv v nemocnici nebo měření. O populaci tedy lze říci, že jde o souhrnné pozorování subjektů seskupených podle společného znaku.
Na rozdíl od vzorku, při provádění statistické analýzy populace, neexistují žádné standardní chyby, které by se měly vykazovat - to je, protože takové chyby informují analytiky pomocí vzorku, do jaké míry se jejich odhad může lišit od skutečné hodnoty populace. Ale protože pracujete se skutečnou populací, znáte skutečnou hodnotu.
OSN označila 11. července za Světový den populace.
Základy populace
Populaci lze definovat jakýmkoli počtem charakteristik ve skupině, které statistici používají k vyvozování závěrů o subjektech ve studii. Populace může být vágní nebo specifická. Mezi příklady populace (neurčitě definované) patří počet novorozenců v Severní Americe, celkový počet technologických začínajících podniků v Asii, průměrná výška všech kandidátů na zkoušku CFA na světě, průměrná hmotnost amerických daňových poplatníků atd.
Konkrétněji lze populaci definovat, například počet novorozenců v Severní Americe s hnědýma očima, počet začínajících v Asii, které selhaly za méně než tři roky, průměrná výška všech kandidátů na zkoušku CFA, průměrná hmotnost všech Američtí daňoví poplatníci starší 30 let.
Statistici a vědci chtějí většinou znát charakteristiky každé entity v populaci, aby mohli vyvodit co nejpřesnější možný závěr. To je však většinou nemožné nebo nepraktické, protože soubory obyvatel mají tendenci být poměrně velké.
Například, pokud společnost chtěla vědět, zda byl každý z jejích 50 000 zákazníků obsluhovaných v průběhu roku spokojen, mohlo by být náročné, nákladné a nepraktické zavolat každému z klientů telefonicky, aby provedl průzkum. Protože vlastnosti každého jednotlivce v populaci nelze měřit kvůli omezením času, zdrojů a dostupnosti, je odebrán vzorek populace.
10 miliard
Množství, o kterém se očekává, že světová populace poroste do poloviny 21. století.
Vzorky populace
Vzorek je náhodný výběr členů populace. Je to menší skupina pocházející z populace, která má vlastnosti celé populace. Pozorování a závěry učiněné na základě údajů ze vzorku jsou připisovány populaci.
Informace získané ze statistického vzorku umožňují statistikům vyvinout hypotézy o větší populaci. Ve statistických rovnicích je populace obvykle označena velkým písmenem N, zatímco vzorek je obvykle označován malým písmenem n.
Parametry populace
Parametr jsou data založená na celé populaci. Statistiky, jako jsou průměry a standardní odchylky, jsou-li převzaty z populací, jsou označovány jako parametry populace. Průměrná populační průměr a standardní odchylka populace jsou představovány řeckými písmeny µ a σ.
Standardní odchylka je odchylka v populaci odvozená ze změny ve vzorku. Je-li směrodatná odchylka dělena druhou odmocninou počtu pozorování ve vzorku, výsledek se označuje jako standardní chyba průměru.
Zatímco parametr je charakteristikou populace, statistika je charakteristikou vzorku. Inferenciální statistika vám umožňuje provést vzdělaný odhad parametru populace na základě statistiky vypočtené ze vzorku náhodně vybraného z této populace.
Klíč s sebou
- Ve statistice je populace celá skupina, ze které je statistický vzorek čerpán. Příkladem populace může být počet novorozenců v Severní Americe, celkový počet technologických startupů v Asii, průměrná výška všech kandidátů na zkoušku CFA v ve světě, průměrná váha daňových poplatníků USA atd. Případy lze porovnat se vzorky.
Příklad skutečného světa
Řekněme například, že výrobce džínového oblečení chce před odesláním do maloobchodních prodejen zkontrolovat kvalitu šití na svých modrých džínách. Není nákladově efektivní zkoumat každý jednotlivý džíny, které výrobce vyrábí (populace). Místo toho výrobce zkoumá pouze 50 párů (vzorek), aby vyvodil závěr, zda je pravděpodobné, že celá populace bude správně sešita.
