Omezená randomizace - Restricted randomization

V statistik , omezen randomizace se vyskytuje v návrhu experimentů a zejména v souvislosti s randomizovaných experimentů a randomizované kontrolované studie . Omezená randomizace umožňuje intuitivně se vyhnout špatnému alokaci léčby experimentálním jednotkám při zachování teoretických výhod randomizace. Například v klinické studii nově navržené léčby obezity ve srovnání s kontrolou by experimentátor chtěl vyhnout se výsledkům randomizace, ve které byla nová léčba přidělena pouze nejtěžším pacientům.

Koncept představili Frank Yates (1948) a William J. Youden (1972) „jako způsob, jak se vyhnout špatným prostorovým vzorům léčby v navržených experimentech.“

Příklad vnořených dat

Zvažte dávkový proces, který v každém běhu používá 7 destiček monitoru. Plán dále požaduje měření proměnné odezvy na každé destičce na každém z 9 míst. Organizace plánu vzorkování má hierarchickou nebo vnořenou strukturu: dávkový běh je nejvyšší úroveň, druhá úroveň je individuální oplatka a třetí úroveň je místo na oplatce.

Celkové množství dat generovaných na dávkový běh bude 7,9 = 63 pozorování. Jedním z přístupů k analýze těchto dat by bylo spočítat průměr všech těchto bodů a jejich standardní odchylku a použít tyto výsledky jako odpovědi pro každý běh.

Analýza dat, jak je navrženo výše, není absolutně nesprávná, ale ztrácí tak informace, které by jinak mohl získat. Například místo 1 na oplatce 1 se fyzicky liší od místa 1 na oplatce 2 nebo na jakékoli jiné oplatce. Totéž platí pro libovolný web na kterékoli z destiček. Podobně se oplatka 1 v běhu 1 fyzicky liší od oplatky 1 v běhu 2 atd. K popisu této situace se říká, že weby jsou vnořeny v oplatkách, zatímco oplatky jsou vnořeny v bězích.

V důsledku tohoto vnoření existují omezení náhodnosti, která mohou v experimentu nastat. Tento druh omezené randomizace vždy vytváří vnořené zdroje variací. Příklady vnořených variací nebo omezené randomizace, o kterých pojednává tato stránka, jsou návrhy split-plot a strip-plot .

Cílem experimentu s tímto typem plánu odběru vzorků je obecně snížit variabilitu způsobenou místy na destičkách a destičkách v rámci běhů (nebo dávek) v procesu. Místa na destičkách a destičkách v dávce se stávají zdroji nežádoucích variací a vyšetřovatel usiluje o to, aby byl systém vůči těmto zdrojům robustní - jinými slovy, v takovém experimentu lze s destičkami a místy zacházet jako s hlukovými faktory.

Vzhledem k tomu, že destičky a stránky představují nežádoucí zdroje variací a protože jedním z cílů je snížit citlivost procesu na tyto zdroje variací, je při analýze dat považovat destičky a weby za náhodné účinky při analýze dat. Jinými slovy, vnořená variace je často dalším způsobem, jak říci vnořené náhodné efekty nebo vnořené zdroje hluku. Pokud se s faktory „oplatky“ a „weby“ zachází jako s náhodnými efekty, pak je možné odhadnout komponentu rozptylu v důsledku každého zdroje odchylek pomocí analýzy technik rozptylu . Jakmile byly získány odhady složek rozptylu, je vyšetřovatel poté schopen určit největší zdroj variací v experimentálním procesu a také určit velikosti ostatních zdrojů variací ve vztahu k největšímu zdroji.

Vnořené náhodné efekty

Pokud má experiment nebo proces vnořené variace, má experiment nebo proces více zdrojů náhodných chyb, které ovlivňují jeho výstup. Mít vnořené náhodné efekty v modelu je stejná věc jako mít vnořené variace v modelu.

Split-plot vzory

Návrhy rozděleného vykreslení vzniknou, když během experimentu došlo k určitému typu omezené randomizace. Jednoduchý faktoriální experiment může vyústit v typ konstrukce typu split-plot kvůli způsobu, jakým byl experiment skutečně proveden.

V mnoha průmyslových experimentech se často vyskytují tři situace:

  1. některé z faktorů zájmu mohou být „těžko měnitelné“, zatímco ostatní faktory se snadno mění. Výsledkem je, že pořadí, ve kterém jsou prováděny kombinace léčby pro experiment, je určeno uspořádáním těchto „těžko měnitelných“ faktorů
  2. experimentální jednotky se zpracovávají společně jako dávka pro jeden nebo více faktorů v konkrétní kombinaci léčby
  3. experimentální jednotky jsou zpracovávány jednotlivě, jeden po druhém, pro stejnou kombinaci léčby bez resetování nastavení faktorů pro tuto kombinaci léčby.

Experimentální příklady split-plot

Experiment spuštěný v jedné z výše uvedených tří situací obvykle vede k typu návrhu typu split-plot. Zvažte experiment, který zkoumá galvanické pokovování hliníku (nevodného) na měděných pásech. Tři zajímavé faktory: aktuální (A); teplota roztoku (T); a koncentrace roztoku potahovacího činidla (S). Rychlost pokovování je měřená odezva. Pro experiment je k dispozici celkem 16 měděných pásků. Kombinace léčby, které se mají spustit (v ortogonálním měřítku), jsou uvedeny níže ve standardním pořadí (tj. Nebyly randomizovány):

Ortogonálně škálované kombinace léčby z 2 3 úplného faktoriálu
Aktuální Teplota Koncentrace
-1 -1 -1
-1 -1 +1
-1 +1 -1
-1 +1 +1
+1 -1 -1
+1 -1 +1
+1 +1 -1
+1 +1 +1

Příklad: některé faktory se těžko mění

Zvažte provedení experimentu za prvních podmínek uvedených výše, přičemž je obtížné měnit koncentraci faktorového roztoku v pokovovacím činidle (S). Jelikož se tento faktor těžko mění, experimentátor by chtěl randomizovat kombinace ošetření tak, aby koncentrační faktor roztoku měl minimální počet změn. Jinými slovy, randomizace běhů zpracování je poněkud omezena úrovní faktoru koncentrace roztoku.

Výsledkem je, že kombinace léčby mohou být randomizovány tak, že nejdříve proběhnou ty léčebné běhy odpovídající jedné úrovni koncentrace (-1). Každý měděný proužek je jednotlivě pokovený, což znamená, že do roztoku pro danou kombinaci ošetření je umístěn pouze jeden proužek najednou. Po dokončení čtyř běhů při nízké úrovni koncentrace roztoku se roztok změní na vysokou úroveň koncentrace (1) a provedou se zbývající čtyři běhy experimentu (kde je opět každý proužek jednotlivě nanesen).

Po dokončení jednoho úplného replikátu experimentu se provede druhá replikace se sadou čtyř měděných proužků zpracovaných pro danou hladinu koncentrace roztoku před změnou koncentrace a zpracováním zbývajících čtyř proužků. Uvědomte si, že úrovně pro zbývající dva faktory lze stále randomizovat. Kromě toho lze také náhodně vybrat úroveň koncentrace, která je spuštěna jako první v replikačních bězích.

Spuštění experimentu tímto způsobem má za následek design děleného pozemku . Koncentrace roztoku je známá jako celý grafový faktor a subplotové faktory jsou aktuální a teplota roztoku.

Návrh split-plot má více než jednu velikost experimentální jednotky . V tomto experimentu je jednou velikostí experimentální jednotka individuální měděný pás. Ošetření nebo faktory, které byly aplikovány na jednotlivé proužky, jsou teplota a proud roztoku (tyto faktory byly změněny pokaždé, když byl do roztoku vložen nový proužek). Druhá nebo větší experimentální jednotka je sada čtyř měděných pásků. Ošetření nebo faktor, který byl aplikován na sadu čtyř proužků, je koncentrace roztoku (tento faktor byl změněn po zpracování čtyř proužků). Experimentální jednotka menší velikosti se označuje jako dílčí grafická experimentální jednotka , zatímco větší experimentální jednotka se označuje jako celá grafická jednotka .

Pro tento experiment existuje 16 dílčích experimentálních jednotek. Teplota a proud roztoku jsou faktory subplot v tomto experimentu. V tomto experimentu jsou čtyři celoplošné experimentální jednotky. Koncentrace roztoku je v tomto experimentu faktorem celého grafu. Protože existují dvě velikosti experimentálních jednotek, jsou v modelu dva chybové výrazy, jeden, který odpovídá chybě celého grafu nebo experimentální jednotce celého grafu, a druhý, který odpovídá chybě dílčího grafu nebo experimentální jednotce dílčího grafu.

Tabulka ANOVA pro tento experiment bude zčásti vypadat takto:

Částečný stůl ANOVA
Zdroj DF
Replikace 1
Koncentrace 1
Chyba (celý graf) = Rep × Conc 1
Teplota 1
Rep × Temp 1
Aktuální 1
Rep × Aktuální 1
Teplota × Konc 1
Rep × Temp × Conc 1
Teplota × proud 1
Rep × Temp × Current 1
Aktuální × Konc 1
Rep × aktuální × konc 1
Teplota × Aktuální × Konc 1
Chyba (Subplot) = Rep × Temp × Current × Conc 1

První tři zdroje pocházejí z úrovně celého grafu, zatímco dalších 12 je z dílčího grafu. K vyhledání statisticky významných pojmů lze použít normální graf pravděpodobnosti odhadů 12 dílčích grafů .

Příklad: dávkový proces

Zvažte spuštění experimentu za druhé podmínky uvedené výše (tj. Dávkový proces), pro které jsou do roztoku najednou umístěny čtyři měděné proužky. Na jednotlivý pás v rámci řešení lze aplikovat specifikovanou úroveň proudu. Spouští se stejných 16 kombinací léčby (replikovaný 2 3 faktoriál), které byly spuštěny v prvním scénáři. Způsob, jakým je experiment prováděn, by se však lišil. Existují čtyři kombinace ošetření teploty a koncentrace roztoku: (-1, -1), (-1, 1), (1, -1), (1, 1). Experimentátor náhodně vybere jeden z těchto čtyř způsobů léčby, který nastaví jako první. Do roztoku jsou umístěny čtyři měděné pásky. Dva ze čtyř proužků jsou náhodně přiřazeny úrovni nízkého proudu. Zbývající dva proužky jsou přiřazeny k úrovni vysokého proudu. Provádí se pokovování a měří se odezva. Zvolí se druhá kombinace ošetření teploty a koncentrace a použije se stejný postup. Toto se provádí pro všechny čtyři kombinace teploty a koncentrace.

Provedení experimentu tímto způsobem také vede k návrhu rozděleného grafu, ve kterém jsou faktory celého grafu nyní koncentrace roztoku a teplota roztoku a faktor subplotu je aktuální.

V tomto experimentu je jednou velikostí experimentální jednotka opět individuální měděný pás. Ošetření nebo faktor, který byl aplikován na jednotlivé proužky, je aktuální (tento faktor byl změněn pokaždé pro jiný proužek v roztoku). Druhou nebo větší experimentální jednotkou je opět sada čtyř měděných pásů. Ošetření nebo faktory, které byly aplikovány na sadu čtyř proužků, jsou koncentrace roztoku a teplota roztoku (tyto faktory byly změněny po zpracování čtyř proužků).

Experimentální jednotka menší velikosti se opět označuje jako experimentální jednotka subplotu. Pro tento experiment existuje 16 dílčích experimentálních jednotek. Proud je v tomto experimentu faktorem subplotu.

Experimentální jednotka větší velikosti je experimentální jednotka celého pozemku. V tomto experimentu jsou čtyři celé experimentální jednotky spiknutí a koncentrace roztoku a teplota roztoku jsou faktory celého spiknutí v tomto experimentu.

Existují dvě velikosti experimentálních jednotek a v modelu jsou dva chybové výrazy: ten, který odpovídá chybě celého grafu nebo experimentální jednotka celého grafu, a ten, který odpovídá chybě dílčího grafu nebo experimentální jednotce dílčího grafu.

ANOVA pro tento experiment vypadá částečně takto:

Částečný stůl ANOVA
Zdroj DF
Koncentrace 1
Teplota 1
Chyba (celý graf) = Conc × Temp 1
Aktuální 1
Konc. × aktuální 1
Teplota × proud 1
Konc. × Teplota × Proud 1
Chyba (subplot) 8

První tři zdroje pocházejí z úrovně celého grafu a dalších 5 pochází z úrovně subplotů. Protože pro chybný termín subplotu existuje 8 stupňů volnosti , lze tento MSE použít k testování každého efektu, který zahrnuje proud.

Příklad: experimentální jednotky zpracovány jednotlivě

Zvažte spuštění experimentu podle třetího scénáře uvedeného výše. V roztoku je najednou pouze jeden měděný pás. Dva proužky, jeden při nízkém proudu a jeden při vysokém proudu, se však zpracovávají jeden po druhém za stejných nastavení teploty a koncentrace. Po zpracování dvou proužků se změní koncentrace a teplota se nastaví na jinou kombinaci. Za této teploty a koncentrace se opět zpracovávají dva proužky, jeden po druhém. Tento proces pokračuje, dokud nebude zpracováno všech 16 měděných pásů.

Provedení experimentu tímto způsobem také vede k návrhu rozděleného grafu, ve kterém jsou faktory celého grafu opět koncentrace roztoku a teplota roztoku a faktor subplotu je aktuální. V tomto experimentu je jednou velikostí experimentální jednotka individuální měděný pás. Ošetření nebo faktor, který byl aplikován na jednotlivé proužky, je aktuální (tento faktor byl změněn pokaždé pro jiný proužek v roztoku). Druhá nebo větší experimentální jednotka je sada dvou měděných pásků. Ošetření nebo faktory, které byly aplikovány na pár dvou proužků, jsou koncentrace roztoku a teplota roztoku (tyto faktory byly změněny po zpracování dvou proužků). Experimentální jednotka menší velikosti se označuje jako experimentální jednotka subplotu.

Pro tento experiment existuje 16 dílčích experimentálních jednotek. Aktuální je faktor subplotu v experimentu. V tomto experimentu je osm celých experimentálních jednotek. Koncentrace roztoku a teplota roztoku jsou faktory celého grafu. V modelu existují dva chybové výrazy, jeden, který odpovídá chybě celého grafu nebo experimentální jednotce celého grafu, a druhý, který odpovídá chybě dílčího grafu nebo experimentální jednotce dílčího grafu.

ANOVA pro tento (třetí) přístup je částečně následující:

Částečný stůl ANOVA
Zdroj DF
Koncentrace 1
Teplota 1
Conc * Temp 1
Chyba (celý graf) 4
Aktuální 1
Konc. × aktuální 1
Teplota × proud 1
Konc. × Teplota × Proud 1
Chyba (subplot) 4

První čtyři termíny pocházejí z analýzy celého pozemku a dalších 5 termínů pochází z analýzy subplotu. Všimněte si, že máme samostatné chybové výrazy jak pro celý graf, tak pro efekty subplotu, každý na základě 4 stupňů volnosti.

Jak je patrné z těchto tří scénářů, jedním z hlavních rozdílů v návrzích split-plot oproti jednoduchým faktoriálním návrhům je počet různých velikostí experimentálních jednotek v experimentu. Návrhy rozděleného grafu mají experimentální jednotku více než jedné velikosti, tj. Více než jeden chybový člen. Protože tyto návrhy zahrnují různé velikosti experimentálních jednotek a různé odchylky, standardní chyby různých středních srovnání zahrnují jednu nebo více odchylek. Určení vhodného modelu pro návrh rozděleného grafu zahrnuje schopnost identifikovat každou velikost experimentální jednotky. Způsob, jakým je experimentální jednotka definována ve vztahu k konstrukční struktuře (například zcela randomizovaný design versus randomizovaný kompletní design bloku ) a struktuře ošetření (například plný 2 3 faktoriál, rozlišení V poloviční zlomek, dvou- struktura léčby způsobem s kontrolní skupinou atd.). V důsledku toho, že experimentální jednotka má větší než jednu velikost, je vhodným modelem použitým k analýze návrhů split-plot smíšený model .

Pokud jsou data z experimentu analyzována pouze s jedním chybovým výrazem použitým v modelu, lze z výsledků vyvodit zavádějící a neplatné závěry.

Strip-plot vzory

Podobně jako u návrhu děleného grafu může být výsledkem návrh proužkového grafu, když během experimentu došlo k určitému typu omezené randomizace. Jednoduchý faktoriální návrh může vyústit v návrh pásu v závislosti na tom, jak byl experiment proveden. Strip-plot designy často vyplývají z experimentů, které jsou prováděny ve dvou nebo více procesních krocích, ve kterých je každý procesní krok dávkovým procesem, tj. Dokončení každé kombinace léčby experimentu vyžaduje více než jeden krok zpracování s experimentálními jednotkami zpracovanými společně v každém procesu krok. Stejně jako v případě návrhu děleného vykreslování vznikají návrhy proužkového vykreslování, když je randomizace v experimentu nějakým způsobem omezena. V důsledku omezené randomizace, ke které dochází u návrhů strip-plot, existuje několik velikostí experimentálních jednotek. Proto existují různé chybové výrazy nebo různé odchylky chyb, které se používají k testování faktorů zájmu v návrhu. Tradiční design strip-plot má tři velikosti experimentálních jednotek.

Příklad strip-plot: dva kroky a tři proměnné faktoru

Zvažte následující příklad z polovodičového průmyslu. Experiment vyžaduje krok implantátu a krok žíhání. V obou fázích nasedání a implantace je třeba otestovat tři faktory. Proces implantace pojme 12 destiček v dávce a implantace jedné destičky za specifikovaných podmínek není praktická ani to neznamená ekonomické použití implantátu. Žíhací pec pojme až 100 destiček.

Nastavení pro dvouúrovňový faktoriální návrh pro tři faktory v kroku implantace jsou označena (A, B, C) a jsou označena dvouúrovňový faktoriální návrh pro tři faktory v kroku žíhání (D, E, F ). Rovněž jsou přítomny interakční účinky mezi faktory implantátu a faktory žíhání. Proto tento experiment obsahuje tři velikosti experimentálních jednotek, z nichž každá má jedinečný chybový termín pro odhad významnosti účinků.

Chcete-li ve výše uvedeném příkladu dát každé experimentální jednotce skutečný fyzický význam, zvažte každou kombinaci kroků implantátu a žíhání jako samostatnou destičku. Nejprve prochází krokem implantátu dávka osmi destiček. Kombinace léčby 3 ve faktorech A, B a C je první běh léčby implantátem. Toto ošetření implantátem se aplikuje na všech osm destiček najednou. Jakmile je dokončeno první ošetření implantátem, je implantována další sada osmi destiček s kombinací léčby 5 faktorů A, B a C. To pokračuje, dokud nebude poslední dávka osmi destiček implantována kombinací léčby 6 faktorů A, B a C. Jakmile bylo spuštěno všech osm kombinací léčby implantačních faktorů, začíná krok žíhání. První kombinací ošetření žíháním je kombinace ošetření 5 faktorů D, E a F. Tato kombinace ošetření žíháním se aplikuje na sadu osmi destiček, přičemž každá z těchto osmi destiček pochází z jedné z osmi kombinací léčby implantátem. Poté, co byla tato první šarže destiček žíhána, je druhé žíhací ošetření aplikováno na druhou šarži osmi destiček, přičemž těchto osm destiček pochází z každé z osmi kombinací ošetření implantátu. To pokračuje, dokud není poslední dávka osmi destiček implantována s konkrétní kombinací faktorů D, E a F.

Provedení experimentu tímto způsobem vede k návrhu proužkového grafu se třemi velikostmi experimentálních jednotek. Sada osmi destiček, které jsou implantovány společně, je experimentální jednotkou pro faktory implantace A, B a C a pro všechny jejich interakce. Existuje osm experimentálních jednotek pro faktory implantátu. Různá sada osmi destiček je žíhána společně. Tato odlišná sada osmi destiček je experimentální jednotkou druhé velikosti a je experimentální jednotkou pro žíhací faktory D, E a F a pro všechny jejich interakce. Třetí experimentální jednotkou je jedna oplatka. Toto je experimentální jednotka pro všechny interakční účinky mezi faktory implantátu a faktory žíhání.

Ve skutečnosti výše uvedený popis proužkového grafu představuje jeden blok nebo jeden replik tohoto experimentu. Pokud experiment neobsahuje žádnou replikaci a model implantátu obsahuje pouze hlavní účinky a dvoufaktorové interakce, poskytuje třífaktorový interakční termín A * B * C (1 stupeň volnosti) chybový termín pro odhad účinků v rámci experimentální jednotka implantátu. Vyvolání podobného modelu pro experimentální jednotku žíhání vytvoří třífaktorový interakční člen D * E * F pro chybový člen (1 stupeň volnosti) pro účinky v experimentální jednotce žíhání.

Viz také

Reference

Další čtení

Podrobnější diskuse o těchto návrzích a příslušných analytických postupech najdete na:

  • Milliken, GA; Johnson, DE (1984). Analýza chaotických dat . 1 . New York: Van Nostrand Reinhold.
  • Miller, A. (1997). "Strip-Plot Configuration of Fractional Factorials". Technometrics . 39 (2): 153–161. doi : 10,2307 / 1270903 . JSTOR   1270903 .

externí odkazy

 Tento článek obsahuje  public domain materiál z webu Národního institutu pro standardy a technologie https://www.nist.gov .