Vzorkování průzkumu - Survey sampling

V statistik , vzorkování průzkumu popisuje proces výběru vzorku prvků z cílové populace, aby provedl průzkum. Termín „ průzkum “ může odkazovat na mnoho různých typů nebo technik pozorování. Při vzorkování průzkumu to nejčastěji zahrnuje dotazník používaný k měření charakteristik a / nebo postojů lidí. Různé způsoby kontaktování členů vzorku, jakmile jsou vybráni, jsou předmětem sběru dat průzkumu . Účelem odběru vzorků je snížit náklady a / nebo množství práce, které by bylo zapotřebí k průzkumu celé cílové populace. Průzkum, který měří celou cílovou populaci, se nazývá sčítání lidu . Vzorek označuje skupinu nebo část populace, od které se mají získat informace

Vzorky průzkumu lze rozdělit do dvou typů: pravděpodobnostní vzorky a super vzorky. Pravděpodobnostní vzorky implementují plán vzorkování se specifikovanými pravděpodobnostmi (možná upravené pravděpodobnosti specifikované adaptivním postupem). Pravděpodobnostní vzorkování umožňuje odvození cílové populace na základě návrhu. Závěry vycházejí ze známého objektivního rozdělení pravděpodobnosti, které bylo specifikováno v protokolu studie. Závěry z průzkumů založených na pravděpodobnosti mohou stále trpět mnoha typy zkreslení.

Průzkumy, které nejsou založeny na pravděpodobnostním vzorkování, mají větší potíže s měřením jejich zkreslení nebo chyby vzorkování . Průzkumy založené na nepravděpodobných vzorcích často nepředstavují lidi v cílové populaci.

V akademickém a vládním průzkumu je vzorkování pravděpodobnosti standardním postupem. Ve Spojených státech uvádí „Seznam standardů pro statistické zjišťování“ Úřadu pro správu a rozpočet, že je nutné provádět federálně financované průzkumy:

výběr vzorků pomocí obecně přijímaných statistických metod (např. pravděpodobnostní metody, které mohou poskytnout odhady chyby vzorkování). Jakékoli použití metod vzorkování bez pravděpodobnosti (např. Mezních vzorků nebo vzorků založených na modelech) musí být statisticky zdůvodněno a musí být schopné měřit chybu odhadu.

Náhodný výběr a odvození na základě návrhu jsou doplněny dalšími statistickými metodami, jako je vzorkování s pomocí modelu a vzorkování na základě modelu.

Například mnoho průzkumů má značnou míru neodpovědí. I když jsou jednotky původně vybrány se známými pravděpodobnostmi, mechanismy neodpovědi nejsou známy. Pro průzkumy s podstatnou neodpovědí statistici navrhli statistické modely, pomocí kterých jsou soubory dat analyzovány.

Otázky související se vzorkováním průzkumu jsou diskutovány v několika zdrojích, včetně Salant a Dillman (1994).

Pravděpodobnostní vzorkování

V pravděpodobnostním vzorku (nazývaném také „vědecký“ nebo „náhodný“ vzorek) má každý člen cílové populace známou a nenulovou pravděpodobnost zařazení do vzorku. Průzkum založený na pravděpodobnostním vzorku může teoreticky vytvořit statistická měření cílové populace, která jsou:

Vzorek průzkumu založený na pravděpodobnosti je vytvořen sestavením seznamu cílové populace, který se nazývá rámec vzorkování , randomizovaný proces pro výběr jednotek z rámce vzorku, nazývaný výběrová procedura, a metoda kontaktování vybraných jednotek, aby mohly dokončit průzkumu, který se nazývá metoda nebo režim sběru dat. Pro některé cílové populace může být tento proces snadný; například vzorkování zaměstnanců společnosti pomocí výplatních listin. U velkých neuspořádaných populací je však jednoduchá konstrukce vhodného rámce vzorku často složitým a nákladným úkolem.

Běžné metody provádění pravděpodobnostního vzorku populace domácností ve Spojených státech jsou Area Probability Sampling, Random Digit Dial sample of phone, and more recent, Address-Based Sampling.

V rámci vzorkování pravděpodobnosti existují specializované techniky, jako je stratifikovaný vzorkování a vzorkování klastrů, které zlepšují přesnost nebo účinnost procesu vzorkování, aniž by měnily základní principy vzorkování pravděpodobnosti.

Stratifikace je proces rozdělení členů populace do homogenních podskupin před odběrem vzorků na základě pomocných informací o každé jednotce vzorku. Vrstvy by se měly vzájemně vylučovat: každý prvek v populaci musí být přiřazen pouze jedné vrstvě. Vrstvy by rovněž měly být kolektivně vyčerpávající: nelze vyloučit žádný prvek populace. Pak lze v každé vrstvě použít metody, jako je jednoduchý náhodný výběr nebo systematické vzorkování . Stratifikace často zlepšuje reprezentativnost vzorku snížením chyby vzorkování.

Předpětí ve vzorkování pravděpodobnosti

Předpětí v průzkumech je nežádoucí, ale často nevyhnutelné. Hlavní typy zkreslení, které se mohou vyskytnout v procesu vzorkování, jsou:

  • Předpětí neodpovědi : Pokud jednotlivci nebo domácnosti vybrané ve vzorku průzkumu nemohou nebo nedokončí průzkum, existuje potenciál zkreslení vyplynout z této neodpovědi. K zkreslení nereagování dochází, když se pozorovaná hodnota odchyluje od parametru populace kvůli rozdílům mezi respondenty a neodpovídajícími.
  • Bias response : Toto není opakem zaujatosti non-response, ale místo toho souvisí s možnou tendencí respondentů z různých důvodů poskytovat nepřesné nebo nepravdivé odpovědi.
  • Předpětí výběru: K předpětí výběru dochází, když mají některé jednotky rozdílnou pravděpodobnost výběru, pro kterou výzkumník nezohledňuje. Například některé domácnosti mají více telefonních čísel, takže je pravděpodobnější, že budou vybrány v telefonním průzkumu, než domácnosti, které mají pouze jedno telefonní číslo. Toto zkreslení výběru by bylo opraveno použitím váhy průzkumu rovnající se [1 / (# telefonních čísel)] pro každou domácnost.
  • Předpojatost vlastního výběru : Typ předpojatosti, při kterém se jednotlivci dobrovolně vybírají do skupiny, čímž potenciálně ovlivňují odpověď dané skupiny.
  • Předpětí účasti : Předpojatost, která vzniká kvůli charakteristikám těch, kteří se rozhodli zúčastnit se průzkumu nebo hlasování.
  • Předpětí pokrytí: Předpětí pokrytí může nastat, když se členové populace neobjeví v rámečku vzorku (nedostatečný příjem). Předpětí pokrytí nastává, když se pozorovaná hodnota odchyluje od parametru populace kvůli rozdílům mezi krytými a nepokrytými jednotkami. Telefonní průzkumy trpí dobře známým zdrojem zkreslení pokrytí, protože nemohou zahrnovat domácnosti bez telefonů.

Nepravděpodobné vzorkování

Mnoho průzkumů není založeno na vzorcích pravděpodobnosti, ale spíše na nalezení vhodné kolekce respondentů pro dokončení průzkumu. Některé běžné příklady nepravděpodobného vzorkování jsou:

  • Rozsudkové vzorky: Výzkumný pracovník rozhodne, které členy populace zahrne do vzorku na základě svého úsudku. Výzkumník může poskytnout alternativní odůvodnění pro reprezentativnost vzorku. Základním předpokladem je, že vyšetřovatel vybere jednotky, které jsou charakteristické pro populaci. Tuto metodu lze podrobit předsudkům a vnímání výzkumníka.
  • Vzorky sněhové koule: Často se používá, když je cílová populace vzácná. Členové cílové populace získávají pro průzkum další členy populace.
  • Ukázky kvót : Vzorek je navržen tak, aby zahrnoval určený počet osob s určitými specifikovanými vlastnostmi. Například 100 pijáků kávy. Tento typ vzorkování je běžný v průzkumech průzkumu trhu, které nejsou pravděpodobné.
  • Pohodlí : Vzorek se skládá z osob, k nimž lze nejsnadněji získat přístup k vyplnění průzkumu.

V nepravděpodobných vzorcích je vztah mezi cílovou populací a vzorkem průzkumu neměřitelný a potenciální zkreslení je nepoznatelné. Sofistikovaní uživatelé vzorků s nepravděpodobným průzkumem mají tendenci prohlížet průzkum jako experimentální podmínku, spíše než jako nástroj pro měření populace, a zkoumat výsledky pro interně konzistentní vztahy.

Viz také

Reference

Další čtení

Učebnice Groves et al. Poskytuje přehled metodologie průzkumu, včetně nedávné literatury o vývoji dotazníků (na základě kognitivní psychologie ):

Další knihy se zaměřují na statistickou teorii vzorkování průzkumu a vyžadují určité znalosti základní statistiky, jak je popsáno v následujících učebnicích:

Základní kniha od Scheaffera et al. Používá kvadratické rovnice ze středoškolské algebry:

  • Scheaffer, Richard L., William Mendenhal a R. Lyman Ott. Vzorkování základního průzkumu , páté vydání. Belmont: Duxbury Press, 1996.

Další matematické statistiky jsou vyžadovány pro Lohra, pro Särndala et al. A pro Cochrana (klasický):

Historicky důležité knihy Deminga a Kisha zůstávají cenné pro postřehy pro sociální vědce (zejména o sčítání lidu v USA a Institutu pro sociální výzkum na University of Michigan ):

externí odkazy