Operační klimatizace - Operant conditioning

Operativní klimatizace

Zánik

Posílení
Zvyšte chování

Trest
Snižte chování

Pozitivní posílení
Přidejte
správný apetit po správném chování

Negativní vyztužení

Pozitivní trest
Přidejte škodlivé
chování následující chování

Negativní trest
Odstranit chutný podnět
následující chování

Útěk
Odstraňte škodlivé podněty
po správném chování

Aktivní vyhýbání
Chování se vyhýbá škodlivým podnětům

Operantní podmiňování (také nazývané instrumentální podmiňování ) je druh procesu asociativního učení, jehož prostřednictvím se síla chování modifikuje posilováním nebo trestáním. Je to také postup, který se používá k dosažení takového učení.

Ačkoli operativní i klasické podmiňování zahrnuje chování ovládané environmentálními podněty, liší se povahou. Při operantním podmiňování je chování řízeno vnějšími podněty. Dítě se například může naučit otevřít krabici, aby do ní dostalo sladkosti, nebo se naučit vyhýbat se dotýkání horkých kamen; operativně řečeno, krabice a kamna jsou „diskriminační podněty“. Chování operátora je prý „dobrovolné“. Odpovědi jsou pod kontrolou organismu a jsou operanty. Dítě může například čelit volbě mezi otevřením boxu a pohlazením štěněte.

Naproti tomu klasické podmiňování zahrnuje nedobrovolné chování založené na párování podnětů s biologicky významnými událostmi. Odpovědi jsou pod kontrolou nějakého podnětu, protože jsou to reflexy, automaticky vyvolané příslušnými podněty. Například při pohledu na sladkosti může dítě slintat nebo zvuk zabouchnutí dveří může signalizovat rozzlobeného rodiče, což dítě chvěje. Slinění a chvění nejsou operanti; nejsou posíleni svými důsledky a nejsou dobrovolně „vyvoleni“.

Oba druhy učení však mohou ovlivnit chování. Klasicky podmíněné podněty - například obrázek sladkostí na krabičce - mohou zlepšit operativní podmiňování tím, že dítě povzbudí k tomu, aby přistoupilo a krabici otevřelo. Výzkum ukázal, že je to výhodný jev v případech, kdy je chování operantů náchylné k chybám.

Studiu učení zvířat ve 20. století dominovala analýza těchto dvou druhů učení a stále jsou jádrem analýzy chování. Byly také použity ke studiu sociální psychologie , což pomáhá objasnit určité jevy, jako je například efekt falešné shody .

Historická poznámka

Edward Lee Thorndike v roce 1912

Thorndikeův zákon účinku

Operační podmiňování, někdy nazývané instrumentální učení , nejprve rozsáhle studoval Edward L. Thorndike (1874–1949), který pozoroval chování koček snažících se uniknout z podomácku vyrobených skládaček. Kočka mohla z boxu uniknout jednoduchou reakcí, jako je tahání za šňůru nebo tlačení tyče, ale když byla poprvé omezena, kočkám trvalo dlouho, než se dostali ven. Při opakovaných pokusech se neúčinné reakce objevovaly méně často a úspěšné reakce se objevovaly častěji, takže kočky utíkaly stále rychleji. Thorndike toto zjištění zobecnil ve svém zákonu účinku , který uvádí, že chování následované uspokojivými důsledky se obvykle opakuje a u těch, které produkují nepříjemné důsledky, je méně pravděpodobné, že se budou opakovat. Stručně řečeno, některé důsledky chování posilují a některé důsledky chování oslabují . Vynesením únikového času proti zkušebnímu číslu vytvořil Thorndike prostřednictvím tohoto postupu první známé křivky učení zvířat .

Zdá se, že se lidé učí mnoho jednoduchého chování prostřednictvím procesu, který studoval Thorndike, kterému se nyní říká operantní podmínění. To znamená, že reakce jsou zachovány, pokud vedou k úspěšnému výsledku, a jsou vyřazeny, pokud ne, nebo když vyvolávají averzivní efekty. Obvykle se to děje, aniž by to plánoval jakýkoli „učitel“, ale operativní podmiňování používají rodiče při výuce svých dětí po tisíce let.

BF Skinner

BF Skinner na Harvardově psychologickém oddělení, kolem roku 1950

BF Skinner (1904–1990) je označován jako otec operantního podmiňování a v souvislosti s tímto tématem je často citována jeho práce. Jeho kniha z roku 1938 „Chování organismů: experimentální analýza“ zahájila jeho celoživotní studium operantního podmiňování a jeho aplikace na chování lidí a zvířat. Podle myšlenek Ernsta Macha Skinner odmítl Thorndikeův odkaz na nepozorovatelné duševní stavy, jako je spokojenost, a svou analýzu postavil na pozorovatelném chování a jeho stejně pozorovatelných důsledcích.

Skinner věřil, že klasické podmiňování je příliš zjednodušující na to, aby se dalo použít k popisu něčeho tak složitého, jako je lidské chování. Operační podmiňování podle jeho názoru lépe popsalo lidské chování, protože zkoumalo příčiny a důsledky úmyslného chování.

Aby implementoval svůj empirický přístup, Skinner vynalezl operativní kondicionační komoru neboli „ Skinner Box “, ve které byli izolováni jedinci jako holubi a krysy a mohli být vystaveni pečlivě kontrolovaným podnětům. Na rozdíl od Thorndikina logického boxu toto uspořádání umožnilo subjektu provést jednu nebo dvě jednoduché, opakovatelné reakce a míra těchto reakcí se stala Skinnerovým primárním měřítkem chování. Další vynález, kumulativní zapisovač, vytvořil grafický záznam, ze kterého bylo možné odhadnout tyto míry odezvy. Tyto záznamy byly primárními daty, která Skinner a jeho kolegové použili k prozkoumání vlivů na míru odezvy různých plánů výztuže. Rozvrh posílení může být definován jako „jakýkoli postup, který dodává posílení organismu podle nějakého dobře definovaného pravidla“. Účinky plánů se následně staly základními poznatky, z nichž Skinner vyvinul svůj popis operantního podmiňování. Vycházel také z mnoha méně formálních pozorování chování lidí a zvířat.

Mnoho Skinnerových spisů se věnuje aplikaci operantního podmiňování lidského chování. V roce 1948 vydal Walden Two , smyšlený popis mírumilovné, šťastné a produktivní komunity organizované podle jeho zásad podmiňování. V roce 1957 Skinner publikoval verbální chování , které rozšířilo principy operantního podmiňování na jazyk, což je forma lidského chování, která byla dříve lingvisty a dalšími analyzována zcela odlišně. Skinner definoval nové funkční vztahy, jako jsou „mands“ a „tacts“, aby zachytil některé základy jazyka, ale nezavedl žádné nové principy, přičemž s verbálním chováním zacházel jako s jakýmkoli jiným chováním ovládaným jeho důsledky, které zahrnovalo reakce publika mluvčího.

Pojmy a postupy

Počátky chování operantů: variabilita operantů

Chování operátora je prý „vyzařováno“; to znamená, že zpočátku to není vyvoláno žádným konkrétním podnětem. Lze se tedy ptát, proč se to vůbec děje. Odpověď na tuto otázku je jako Darwinova odpověď na otázku původu „nové“ tělesné struktury, konkrétně variace a výběru. Podobně se chování jednotlivce mění od okamžiku k okamžiku v takových aspektech, jako jsou konkrétní pohyby, množství použité síly nebo načasování reakce. Variace, které vedou k vyztužení, jsou posíleny, a pokud je výztuž konzistentní, chování má tendenci zůstat stabilní. Variabilitu chování lze však změnit pomocí manipulace s určitými proměnnými.

Změna chování operantů: posílení a trest

Posílení a trest jsou základními nástroji, kterými se mění chování operantů. Tyto termíny jsou definovány jejich účinkem na chování. Buď může být pozitivní nebo negativní.

Pozitivní posílení a negativní posílení zvyšuje pravděpodobnost chování, které následují, zatímco pozitivní trest a negativní trest snižují pravděpodobnost chování, kterým se řídí.

Další postup se nazývá „zánik“.

K zániku dochází, když dříve zesílené chování již není vyztuženo pozitivní ani negativní výztuží. Během vyhynutí je chování méně pravděpodobné. Občasné posílení může vést k ještě delšímu zpoždění před vyhynutím chování kvůli faktoru učení, kdy se opakované instance stávají nezbytnými pro získání posílení, ve srovnání s posílením podávaným při každé příležitosti před zánikem.

Důsledků je celkem pět.

K pozitivnímu posílení dochází, když je chování (reakce) odměnou nebo za chováním následuje další podnět, který odměňuje, čímž se frekvence tohoto chování zvyšuje. Pokud například krysa ve Skinnerově boxu dostane jídlo, když stiskne páku, rychlost lisování se zvýší. Tento postup se obvykle nazývá jednoduše zesílení .
Negativní posílení (aka útěk) nastává, když za chováním (reakcí) následuje odstranění averzivního podnětu, čímž se zvyšuje frekvence původního chování. V experimentu Skinner Box může být averzivním stimulem nepřetržitý hlasitý zvuk uvnitř krabice; negativní zesílení by nastalo, když krysa stiskne páčku, aby vypnula hluk.
Pozitivní trest (označovaný také jako „trest podmíněnou stimulací“) nastává, když za chováním (reakcí) následuje averzivní podnět. Příklad: bolest z výprasku , která by často vedla ke snížení tohoto chování. Pozitivní trest je matoucí termín, proto se postupu obvykle říká „trest“.
Negativní trest (trest) (také nazývaný „trest podmíněným stažením“) nastává, když po chování (reakci) následuje odstranění podnětu. Příklad: odebrání dětské hračky po jeho nežádoucím chování, které by mělo za následek snížení nežádoucího chování.
K zániku dochází, když chování (reakce), které bylo dříve posíleno, již není účinné. Příklad: krysa dostane nejprve potravu mnohokrát za stisknutí páky, dokud experimentátor již nevydá jídlo jako odměnu. Krysa obvykle stiskne páku méně často a pak se zastaví. Lisování páky by pak bylo řečeno, že „zhaslo“.

Je důležité si uvědomit, že o hercích (např. Krysa) se nemluví jako o posílení, potrestání nebo uhašení; jsou to akce, které jsou posíleny, potrestány nebo uhaseny. Posílení, trest a zánik nejsou pojmy, jejichž použití je omezeno na laboratoř. Přirozeně se vyskytující důsledky mohou také posílit, potrestat nebo uhasit chování a nejsou vždy plánovány nebo dodávány záměrně.

Rozvrhy výztuže

Plány výztuže jsou pravidla, která řídí dodávku výztuže. Pravidla určují buď čas, kdy má být výztuž zpřístupněna, nebo počet odpovědí, které mají být provedeny, nebo obojí. Je možné mnoho pravidel, ale následující jsou nejzákladnější a běžně používaná

Plán s pevným intervalem: K výztuži dochází po první reakci po uplynutí pevného času po předchozím vyztužení. Tento rozvrh poskytuje vzorec reakce „přestávka“; to znamená, že po tréninku podle tohoto rozvrhu se organismus po posílení obvykle zastaví a poté začne rychle reagovat, jak se blíží čas pro další posílení.
Plán variabilních intervalů: K výztuži dochází po první reakci po uplynutí proměnného času od předchozí výztuže. Tento rozvrh obvykle poskytuje relativně stabilní rychlost odezvy, která se mění s průměrným časem mezi posilami.
Plán s pevným poměrem: K výztuži dochází poté, co byl vydán pevný počet odpovědí od předchozího vyztužení. Organismus trénovaný podle tohoto rozvrhu se obvykle po posílení na chvíli pozastaví a poté reaguje vysokou rychlostí. Pokud je požadavek na odpověď nízký, nemusí dojít k pozastavení; pokud je požadavek na odpověď vysoký, organismus může přestat reagovat úplně.
Rozvrh s proměnným poměrem: K vyztužení dochází poté, co byl od předchozího vyztužení vydán proměnný počet odpovědí. Tento rozvrh obvykle přináší velmi vysokou a trvalou míru odezvy.
Nepřetržité vyztužení: Ke zpevnění dochází po každé reakci. Organismy obvykle reagují tak rychle, jak mohou, s ohledem na čas potřebný k získání a spotřebování výztuže, dokud nejsou nasyceni.

Faktory, které mění účinnost posilování a trestání

Účinnost posilování a trestání lze změnit.

Uspokojení/deprivace : Účinnost pozitivního nebo „apetitivního“ stimulu se sníží, pokud jedinec přijal dostatek tohoto stimulu k uspokojení svého apetitu. Opačný účinek nastane, pokud se jedinec zbaví tohoto podnětu: účinnost následku se pak zvýší. Subjekt s plným žaludkem by se necítil tak motivovaný jako hladový.
Bezprostřednost : Okamžitý následek je účinnější než zpoždění. Pokud někdo dá psovi pamlsek na sezení do pěti sekund, pes se naučí rychleji, než když je pamlsek podán po třiceti sekundách.
Pohotovostní situace : Aby bylo posilování nejúčinnější, mělo by k němu docházet důsledně po reakcích a ne jindy. Učení může být pomalejší, pokud je posilování přerušované, to znamená, že se řídíte pouze některými instancemi stejné reakce. Odpovědi zesílené přerušovaně se hasí obvykle pomaleji než reakce, které byly vždy posilovány.
Velikost : Velikost nebo množství stimulu často ovlivňuje jeho sílu jako posilovače. Lidé a zvířata se zabývají analýzou nákladů a přínosů. Pokud pákový lis přináší deset potravinových pelet, lze se pákové lisování naučit rychleji, než když lis přináší pouze jednu peletu. Hromada čtvrtí z hracího automatu může hráče udržet tahání páky déle než jednu čtvrtinu.

Většina těchto faktorů slouží biologickým funkcím. Například proces nasycení pomáhá organismu udržovat stabilní vnitřní prostředí ( homeostázu ). Když je organismus například zbaven cukru, chuť cukru je účinným posilovačem. Když krevní cukr organismu dosáhne nebo překročí optimální úroveň, chuť cukru se stane méně účinnou nebo dokonce averzivní.

Tvarování

Shaping je kondiční metoda, která se velmi často používá při výcviku zvířat a při výuce neverbálních lidí. Záleží na operativní variabilitě a zesílení, jak je popsáno výše. Trenér začíná identifikací požadovaného konečného (nebo „cílového“) chování. Dále trenér zvolí chování, které zvíře nebo osoba již s určitou pravděpodobností vydává. Forma tohoto chování se pak postupně mění v postupných pokusech posilováním chování, které se blíže přibližuje cílovému chování. Když je cílové chování konečně vysláno, může být posíleno a udržováno pomocí plánu výztuže.

Nesouhlasná výztuž

Nesouhlasné posilování je dodávání posilujících podnětů bez ohledu na chování organismu. Nesouhlasné zesílení může být použito ve snaze snížit nežádoucí chování cíle posílením více alternativních reakcí při hašení reakce cíle. Vzhledem k tomu, že žádné měřené chování není identifikováno jako posilované, je kolem používání pojmu nekontinentální „vyztužení“ polemika.

Řízení stimulačního chování operantů

Ačkoli původně operativní chování je vysíláno bez identifikovaného odkazu na určitý podnět, během operantního podmiňování se operanti dostávají pod kontrolu podnětů, které jsou přítomny, když je chování posíleno. Takové podněty se nazývají „diskriminační podněty“. Výsledkem je takzvaná „ tříletá událost “. To znamená, že diskriminační podněty vytvářejí příležitost pro reakce, které produkují odměnu nebo trest. Příklad: potkan může být vycvičen ke stisknutí páky, pouze když se rozsvítí kontrolka; pes spěchá do kuchyně, když slyší chrastění jeho sáčku s jídlem; dítě sáhne po cukroví, když ho uvidí na stole.

Diskriminace, generalizace a kontext

Většina chování je pod kontrolou stimulu. Lze rozlišit několik aspektů:

K diskriminaci obvykle dochází, když je reakce posílena pouze za přítomnosti konkrétního stimulu. Například holub může být krmen za klování na červené světlo, a ne na zelené světlo; v důsledku toho klepe na červenou a přestane klovat na zelenou. Bylo studováno mnoho složitých kombinací podnětů a dalších podmínek; například organismus může být posílen v intervalovém rozvrhu za přítomnosti jednoho podnětu a v poměrovém rozvrhu za přítomnosti jiného.
Zobecnění je tendence reagovat na podněty, které jsou podobné dříve trénovanému diskriminačnímu podnětu. Například, když byl holub vycvičen k piknutí na „červenou“, mohl by také klovat na „růžovou“, i když obvykle méně silně.
Kontext se týká podnětů, které jsou nepřetržitě přítomny v situaci, jako jsou stěny, stoly, židle atd. V místnosti nebo vnitřku operativní klimatizační komory. Kontextové podněty mohou ovládat chování stejně jako diskriminační podněty, i když obvykle slabší. Chování naučená v jednom kontextu může v jiném chybět nebo být pozměněna. To může způsobovat potíže v behaviorální terapii, protože chování naučené v terapeutickém prostředí nemusí v jiných situacích nastat.

Behaviorální sekvence: podmíněné zesílení a řetězení

Většinu chování nelze snadno popsat z hlediska jednotlivých reakcí posílených jeden po druhém. Rozsah operantní analýzy je rozšířen o myšlenku řetězců chování, což jsou sekvence odpovědí svázaných dohromady pomocí tří termínových podmíněností definovaných výše. Řetězení je založeno na experimentálně prokázané skutečnosti, že diskriminační podnět nejen vytváří příležitost pro následné chování, ale může také posílit chování, které mu předchází. To znamená, že diskriminační podnět je také „podmíněným posilovačem“. Například světlo, které nastavuje příležitost pro stlačení páky, může být použito k posílení „otáčení“ za přítomnosti hluku. Výsledkem je sekvence „hluk-otočení-světlo-stiskněte páčku-jídlo“. Mnohem delší řetězce lze vybudovat přidáním dalších podnětů a reakcí.

Útěk a vyhýbání se

Při únikovém učení chování ukončí (averzivní) podnět. Například ochrana očí před slunečním zářením ukončí (averzivní) stimulaci jasného světla v očích. (Toto je příklad negativního vyztužení, definovaného výše.) Chování, které je udržováno bráněním stimulu, se nazývá „vyhýbání se“, jako například nasazení slunečních brýlí před odchodem ven. Vyhýbavé chování vyvolává takzvaný „paradox vyhýbání se“, protože se lze ptát, jak může neexistence stimulu posloužit jako posilovač? Tuto otázku řeší několik teorií vyhýbání se (viz níže).

Běžně se používají dva druhy experimentálních nastavení: diskriminační a volně se vyhýbající učení vyhýbání se.

Diskriminované učení vyhýbání se

Diskriminovaný vyhýbací se experiment zahrnuje sérii pokusů, ve kterých po neutrálním podnětu, jako je světlo, následuje averzivní podnět, jako je šok. Poté, co se objeví neutrální podnět, operativní reakce, jako je stisk páky, zabrání nebo ukončí averzivní podnět. V raných zkouškách subjekt nereaguje, dokud nenastane averzivní podnět, proto se těmto raným zkouškám říká „únikové“ zkoušky. Jak učení postupuje, subjekt začíná reagovat během neutrálního podnětu a brání tak averzivnímu podnětu. Takové zkoušky se nazývají „zkoušky vyhýbání se“. Tento experiment údajně zahrnuje klasické podmiňování, protože neutrální CS (podmíněný podnět) je spárován s averzivním US (nepodmíněný podnět); tato myšlenka je základem níže popsané dvoufaktorové teorie vyhýbání se učení.

Free-operant vyhýbání se učení

Při vyhýbání se volně působícímu subjektu subjekt pravidelně dostává averzivní podnět (často elektrický šok), pokud nedojde k operativní reakci; reakce oddaluje nástup šoku. V této situaci, na rozdíl od diskriminovaného vyhýbání se, žádný předchozí podnět nesignalizuje šok. Míru vyhýbání se učení určují dva zásadní časové intervaly. Toto je první interval SS (šok-šok). Toto je čas mezi po sobě jdoucími šoky při absenci odpovědi. Druhým intervalem je interval RS (response-shock). Toto určuje čas, o který operativní reakce oddálí nástup dalšího šoku. Všimněte si, že pokaždé, když subjekt provede operativní reakci, začne interval RS bez šoku znovu.

Dvouprocesní teorie vyhýbání se

Tato teorie byla původně navržena za účelem vysvětlení diskriminačního vyhýbání se učení, ve kterém se organismus učí vyhýbat averzivnímu podnětu útěkem ze signálu pro tento podnět. Jedná se o dva procesy: klasické podmínění signálu následované operativní podmíněností únikové reakce:

a) Klasické podmiňování strachu. Organismus zpočátku zažívá párování CS s averzivním USA. Teorie předpokládá, že toto párování vytváří spojení mezi CS a USA prostřednictvím klasického podmiňování a kvůli averzivní povaze USA CS začíná vyvolávat podmíněnou emoční reakci (CER) - „strach“. b) Posílení operativní reakce redukcí strachu. V důsledku prvního procesu nyní CS signalizuje strach; tato nepříjemná emoční reakce slouží k motivaci operativních reakcí a reakce, které ukončují CS, jsou posíleny ukončením strachu. Všimněte si, že teorie neříká, že se organismus „vyhýbá“ USA ve smyslu jeho očekávání, ale že organismus „uniká“ averzivnímu vnitřnímu stavu, který je způsoben CS. Několik experimentálních zjištění se zdá být v rozporu s dvoufaktorovou teorií. Například vyhýbavé chování často zhasíná velmi pomalu, i když se počáteční párování CS-USA již nikdy neobjeví, takže lze očekávat, že odezní strach (viz Klasické podmiňování ). Kromě toho zvířata, která se naučila vyhýbat, často vykazují jen málo důkazů o strachu, což naznačuje, že únik ze strachu není nutný k udržení vyhýbavého chování.

Operantní nebo „jednofaktorová“ teorie

Někteří teoretici naznačují, že vyhýbavé chování může být jednoduše zvláštním případem operantního chování udržovaného jeho důsledky. V tomto pohledu je myšlenka „důsledků“ rozšířena o citlivost na vzorec událostí. V vyhýbání se tedy důsledkem reakce je snížení rychlosti averzivní stimulace. Experimentální důkazy skutečně naznačují, že „zmeškaný šok“ je detekován jako stimul a může působit jako zesilovač. Kognitivní teorie vyhýbání se posouvají tuto myšlenku o krok dál. Krysa například začne „očekávat“ šok, pokud nestiskne páku, a „neočekává žádný šok“, když na něj stiskne, a vyhýbavé chování se posílí, pokud se tyto očekávání potvrdí.

Hromadění operátorů

Hromadění operantů se týká pozorování, že krysy zesílené určitým způsobem mohou umožnit nahromadění potravinových pelet v misce s jídlem místo jejich získání. Při tomto postupu získávání pelet vždy zavedlo jednominutové období vyhynutí, během kterého nebyly k dispozici žádné další potravinové pelety, ale ty, které byly nahromaděny dříve, mohly být spotřebovány. Toto zjištění se zdá být v rozporu s obvyklým zjištěním, že se krysy chovají impulzivně v situacích, kdy existuje možnost volby mezi menším potravinovým předmětem hned a větším potravinovým předmětem po určitém zpoždění. Viz plány výztuže .

Neurobiologické koreláty

První vědecké studie identifikující neurony, které reagovaly způsoby, které naznačovaly, že kódují podmíněné podněty, pocházely z práce Mahlona deLonga a RT Richardsona. Ukázali, že neurony nucleus basalis , které uvolňují acetylcholin široce v celé mozkové kůře , jsou aktivovány krátce po podmíněném podnětu nebo po primární odměně, pokud žádný podmíněný podnět neexistuje. Tyto neurony jsou stejně aktivní pro pozitivní i negativní zesilovače a bylo prokázáno, že souvisí s neuroplasticitou v mnoha kortikálních oblastech. Existuje také důkaz, že dopamin je aktivován v podobných časech. Existuje značný důkaz, že dopamin se účastní posilování i averzivního učení. Dopaminové dráhy promítají mnohem hustěji do oblastí frontální kůry . Cholinergní projekce jsou naopak husté i v pozdějších kortikálních oblastech, jako je primární zraková kůra . Studie pacientů s Parkinsonovou nemocí , což je stav přisuzovaný nedostatečnému účinku dopaminu, dále ilustruje úlohu dopaminu při pozitivním posilování. Ukázalo se, že zatímco pacienti byli bez léků, učili se ochotněji s averzivními důsledky než s pozitivním posilováním. Pacienti, kteří užívali léky, prokázali opak a pozitivní posílení se ukázalo jako účinnější forma učení, když je aktivita dopaminu vysoká.

Neurochemický proces zahrnující dopamin byl navržen jako základ výztuže. Když organismus zažije posilující podnět, aktivují se v mozku dráhy dopaminu . Tato síť cest „uvolňuje krátký pulz dopaminu na mnoho dendritů , čímž vysílá signál globálního posílení do postsynaptických neuronů “. To umožňuje nedávno aktivovaným synapsím zvýšit jejich citlivost na eferentní (vedení ven) signály, čímž se zvyšuje pravděpodobnost výskytu u nedávných reakcí, které předcházely zesílení. Tyto odpovědi jsou statisticky nejpravděpodobnějším chováním odpovědným za úspěšné dosažení posílení. Pokud je však aplikace výztuže buď méně bezprostřední, nebo méně podmíněná (méně konzistentní), schopnost dopaminu působit na příslušné synapsí je snížena.

Otázky týkající se zákona účinnosti

Zdá se, že řada pozorování ukazuje, že operativní chování lze stanovit bez posílení ve smyslu definovaném výše. Nejcitovanější je fenomén automatického tvarování (někdy se mu také říká „sledování stopy“), kdy po stimulu opakovaně následuje zesílení a v důsledku toho zvíře začne na podnět reagovat. Například se rozsvítí klíč odpovědi a poté se zobrazí jídlo. Když se to několikrát opakuje, holubí subjekt začne klíčit klíč, přestože přijde jídlo, ať už pták píchne nebo ne. Podobně krysy začínají manipulovat s malými předměty, jako je páka, když je poblíž prezentováno jídlo. Stávkující je, že holuby a krysy v tomto chování přetrvávají, i když klování klíče nebo stisknutí páčky vede k menšímu množství jídla (vynechání). Dalším zjevným operantním chováním, které se objevuje bez výztuže, je protiproudové zatížení .

Tato pozorování a další se zdají být v rozporu se zákonem účinku a přiměli některé vědce navrhnout nové konceptualizace operantní výztuže (např.) Obecnější pohled je, že autošaping je příkladem klasického podmínění ; postup automatického tvarování se ve skutečnosti stal jedním z nejběžnějších způsobů měření klasického podmínění. V tomto pohledu lze mnoho chování ovlivnit jak klasickými událostmi (podnět-reakce), tak operativními událostmi (odezva-posílení) a úkolem experimentátora je zjistit, jak na sebe vzájemně působí.

Aplikace

Posílení a tresty jsou v lidských sociálních interakcích všudypřítomné a bylo navrženo a implementováno mnoho aplikací základních principů. Následuje několik příkladů.

Závislost a závislost

Pozitivní a negativní posílení hraje ústřední roli v rozvoji a udržování závislosti a drogové závislosti . Návyková droga je sama o sobě odměnou ; to znamená, že funguje jako primární pozitivní posilovač užívání drog. Mozkový systém odměn mu přiřazuje incentivní význam (tj. Je „chtěný“ nebo „žádaný“), takže jak se vyvíjí závislost, deprivace drogy vede k touze. Kromě toho se podněty spojené s užíváním drog - např. Pohled na injekční stříkačku a místo použití - spojují s intenzivním posilováním vyvolaným léčivem. Tyto dříve neutrální podněty získávají několik vlastností: jejich vzhled může vyvolat touhu a mohou se stát podmíněnými pozitivními posilovači dalšího používání. Pokud se tedy závislý jedinec setká s jedním z těchto podnětů k drogám, může se znovu objevit touha po přidruženém léku. Protidrogové agentury například dříve používaly plakáty s obrázky drogových doplňků jako pokus ukázat nebezpečí užívání drog. Takové plakáty se však již nepoužívají kvůli účinkům incentivní motivace při vyvolání relapsu při pohledu na podněty znázorněné na plakátech.

U jedinců závislých na drogách dochází k negativnímu zesílení, když je lék podáván samostatně, aby se zmírnily nebo „unikly“ příznaky fyzické závislosti (např. Třes a pocení) a/nebo psychické závislosti (např. Anhedonie , neklid, podrážděnost a úzkost), které vznikají během stavu vysazení léku .

Výcvik zvířat

Trenéři zvířat a majitelé domácích mazlíčků uplatňovali zásady a postupy operativní kondice dlouho předtím, než byly tyto myšlenky pojmenovány a studovány, a výcvik zvířat stále poskytuje jeden z nejjasnějších a nejpřesvědčivějších příkladů operativní kontroly. Z konceptů a postupů popsaných v tomto článku, některé z nejvýznamnějších jsou následující: (a) dostupnost primární výztuže (např. Pytel psích mňamek); (b) použití sekundární výztuže (např. zazvonění klikáním bezprostředně po požadované odezvě, poté vydávání lahůdek); (c) nahodilost, zajištění, že posílení (např. klikr) následuje požadované chování a ne něco jiného; (d) tvarování, jako při postupném získávání psa, aby skákal výš a výš; e) přerušované posilování, jako při postupném snižování frekvence posilování k navození trvalého chování bez nasycení; f) řetězení, kde je z menších jednotek postupně konstruováno komplexní chování.

Příklad výcviku zvířat od společnosti Seaworld týkajícího se operativního podmiňování

Výcvik zvířat má vliv na pozitivní a negativní posílení. Rozvrhy posil mohou v případě výcviku zvířat hrát velkou roli.

Aplikovaná analýza chování

Analýza aplikovaného chování je disciplína iniciovaná BF Skinnerem, která aplikuje principy podmiňování na modifikaci sociálně významného lidského chování. Využívá základní pojmy teorie podmiňování, včetně podmíněného podnětu (S ^C ), diskriminačního podnětu (S ^d ), reakce (R) a posilujícího podnětu (S ^otěže nebo S ^r pro posilovače, někdy S ^ave pro averzivní podněty). Podmíněný podnět ovládá chování vyvinuté prostřednictvím respondentova (klasického) podmiňování, jako jsou emoční reakce. Zbylé tři pojmy tvoří Skinnerovu „tříletou pohotovost“: diskriminační podnět vytváří příležitost pro reakce, které vedou k posílení. Vědci zjistili, že následující protokol je účinný, když k úpravě lidského chování používají nástroje operantního podmínění:

Cíl státu Ujasněte si přesně, jaké změny mají být provedeny. Například „snižte váhu o 30 liber“.
Monitorujte chování Sledujte chování, abyste viděli, zda dochází k požadovaným efektům. Například si vytvořte graf denních hmotností.
Posílit požadované chování Například pogratulovat jednotlivci k hubnutí. U lidí může záznam o chování sloužit jako posila. Například, když účastník vidí vzorec hubnutí, může to posílit pokračování v behaviorálním programu hubnutí. Jedinci však mohou vnímat posílení, které má být pozitivní, jako negativní a naopak. Záznam o ztrátě hmotnosti může například působit jako negativní posila, pokud člověku připomene, jak těžký ve skutečnosti je. Tokenu ekonomika , je výměnný systém, ve kterém jsou tokeny uvedeny jako odměnu za žádoucí chování. Tokeny mohou být později vyměněny za požadovanou cenu nebo odměny, jako je síla, prestiž, zboží nebo služby.
Omezte pobídky k nežádoucímu chování Odstraňte například cukrovinky a tučné svačiny z kuchyňských polic.

Praktici aplikované behaviorální analýzy (ABA) přinášejí tyto postupy a jejich mnoho variací a vývojů k řešení řady společensky významných chování a problémů. V mnoha případech praktici používají operativní techniky k rozvoji konstruktivního, společensky přijatelného chování, které nahradí aberantní chování. Techniky ABA byly účinně použity v takových věcech, jako jsou včasné intenzivní behaviorální intervence u dětí s poruchou autistického spektra (ASD), výzkum principů ovlivňujících kriminální chování , prevence HIV, zachování přírodních zdrojů, vzdělávání, gerontologie , zdraví a cvičení , průmyslová bezpečnost , osvojování jazyka , odhazování odpadků, lékařské postupy , rodičovství, psychoterapie , používání bezpečnostních pásů, závažné duševní poruchy , sport, zneužívání návykových látek , fobie , dětské poruchy krmení a správa zoo a péče o zvířata . Některé z těchto aplikací patří mezi níže popsané.

Chování dítěte - školení rodičovského managementu

Poskytování pozitivního posílení vhodného chování dítěte je hlavním zaměřením školení rodičovského managementu. Rodiče se obvykle naučí odměňovat přiměřené chování prostřednictvím sociálních odměn (jako jsou chvály, úsměvy a objetí) a také konkrétních odměn (jako jsou nálepky nebo body směrem k větší odměně jako součást motivačního systému vytvořeného ve spolupráci s dítětem). Rodiče se navíc učí vybírat jednoduché chování jako počáteční zaměření a odměňovat každý z malých kroků, kterých jejich dítě dosáhne k dosažení většího cíle (tomuto konceptu se říká „postupné přibližování“).

Ekonomika

Psychologové i ekonomové se začali zajímat o aplikaci operativních konceptů a zjištění na chování lidí na trhu. Příkladem je analýza spotřebitelské poptávky podle indexu nakoupeného zboží. V ekonomii se míra, do jaké cena ovlivňuje spotřebu, nazývá „cenová elasticita poptávky“. Některé komodity jsou pružnější než jiné; například změna ceny některých potravin může mít velký vliv na nakoupené množství, zatímco benzín a jiný každodenní spotřební materiál mohou být změnami cen méně ovlivněny. Pokud jde o operativní analýzu, mohou být tyto efekty interpretovány jako motivace spotřebitelů a relativní hodnota komodit jako posilovače.

Hazardní hry - plánování s proměnným poměrem

Jak již bylo uvedeno dříve v tomto článku, rozvrh s proměnným poměrem přináší posílení po vyslání nepředvídatelného počtu reakcí. Tento plán obvykle generuje rychlé a trvalé reakce. Hrací automaty se vyplácejí podle rozvrhu s proměnným poměrem a v hazardních hrách produkují právě tento druh trvalého chování při tahání páky. Proměnlivý poměr výplaty z hracích automatů a jiných forem hazardních her byl často citován jako faktor, který je základem závislosti na hazardních hrách.

Vojenská psychologie

Lidské bytosti mají vrozený odpor k zabíjení a zdráhají se jednat přímo, agresivně vůči příslušníkům svého vlastního druhu, dokonce i zachránit život. Tento odpor k zabíjení způsobil, že pěchota byla v celé historii vojenské války pozoruhodně neefektivní.

Tento jev nebyl pochopen, dokud SLA Marshall (brigádní generál a vojenský historik) neprovedl rozhovorové studie s pěchotou 2. světové války bezprostředně po bojovém střetnutí. Marshallova známá a kontroverzní kniha Muži proti ohni odhalila, že pouze 15% vojáků střílelo z pušek za účelem zabíjení v boji. Po přijetí Marshallova výzkumu americkou armádou v roce 1946 zahájil Úřad pro výzkum lidských zdrojů americké armády implementaci nových tréninkových protokolů, které se podobají metodám operativní kondicionování. Následné aplikace těchto metod zvýšily procento vojáků schopných zabíjet na přibližně 50% v Koreji a přes 90% ve Vietnamu. Revoluce ve výcviku zahrnovaly nahrazení tradičních vyskakovacích střelnic trojrozměrnými vyskakovacími terči ve tvaru člověka, které se při zásahu zhroutily. To poskytlo okamžitou zpětnou vazbu a působilo jako pozitivní posílení chování vojáka. Mezi další vylepšení metod vojenského výcviku patří kurz střelby s načasováním; realističtější školení; vysoké opakování; pochvala od nadřízených; odměny za střelbu; a uznání skupiny. Negativní posílení zahrnuje vzájemnou odpovědnost nebo požadavek na opakování kurzů. Moderní vojenský výcvik podmiňuje odezvu středního mozku na bojový tlak úzkou simulací skutečného boje s využitím hlavně pavlovského klasického podmiňování a skinnerovského operantního podmiňování (obě formy behaviorismu ).

Moderní střelecký výcvik je natolik vynikajícím příkladem behaviorismu, že je již léta používán v úvodním kurzu psychologie vyučovaném všem kadetům na americké vojenské akademii ve West Pointu jako klasický příklad operantního podmiňování. V 80. letech 20. století, během návštěvy West Pointu, identifikoval BF Skinner moderní výcvik vojenské střelby jako téměř dokonalou aplikaci operantního podmiňování.

Podplukovník Dave Grossman o operativním podmiňování a americkém vojenském výcviku uvádí, že:

Je zcela možné, že se nikdo záměrně neposadil a nepoužil techniky operativního podmiňování nebo modifikace chování k výcviku vojáků v této oblasti ... Ale z pohledu psychologa, který je také historikem a vojákem z povolání, je mi čím dál tím zjevnější, že přesně toho bylo dosaženo.

Nudge teorie

Nudge theory (nebo nudge) je koncept v behaviorální vědě , politické teorii a ekonomii, který tvrdí, že nepřímé návrhy, jak se pokusit dosáhnout nucené shody, mohou ovlivnit motivy, pobídky a rozhodování skupin a jednotlivců, přinejmenším stejně efektivně-pokud ne efektivněji - než přímé instrukce, legislativa nebo prosazování.

Chvála

Koncept chvály jako prostředku posilování chování je zakořeněn v modelu operativního podmiňování BF Skinnera. Prostřednictvím této čočky byla chvála vnímána jako prostředek pozitivního vyztužení, kde je pravděpodobnější, že nastane pozorované chování, tím, že se toto chování bude chválit. Stovky studií prokázaly účinnost chvály při podpoře pozitivního chování, zejména při studiu chvály učitele a rodičů na dítě při podpoře zlepšeného chování a akademických výkonů, ale také při studiu pracovního výkonu. Bylo také prokázáno, že chvála posiluje pozitivní chování u nechválených sousedních jedinců (jako je spolužák příjemce chvály) prostřednictvím zástupného posilování. Pochvala může být více či méně účinná při změně chování v závislosti na její formě, obsahu a doručení. Aby chvála vedla ke změně pozitivního chování, musí být závislá na pozitivním chování (tj. Podává se pouze po uzákonění cíleného chování), musí specifikovat podrobnosti o chování, které má být posíleno, a musí být poskytováno upřímně a věrohodně.

Uznávajíce efekt chvály jako strategie pozitivního posílení, četné behaviorální a kognitivní behaviorální intervence zahrnovaly používání pochval do svých protokolů. Strategické používání chvály je uznáváno jako praxe založená na důkazech jak při intervencích vedení třídy, tak při výchově rodičů, ačkoli pochvala je často zahrnuta v intervenčním výzkumu do větší kategorie pozitivního posílení, která zahrnuje strategie, jako je strategická pozornost a odměňování za chování.

Bylo provedeno několik studií o vlivu kognitivně-behaviorální terapie a operantně-behaviorální terapie na různé zdravotní stavy. Když se u pacientů vyvinuly kognitivní a behaviorální techniky, které změnily jejich chování, postoje a emoce; jejich intenzita bolesti se snížila. Výsledky těchto studií ukázaly, že vliv poznávání na vnímání bolesti a její dopad vysvětlil obecnou účinnost kognitivně-behaviorální terapie (CBT) a operativní-behaviorální terapie (OBT).

Psychologická manipulace

Braiker identifikoval následující způsoby, jak manipulátory ovládají své oběti:

Pozitivní posílení : zahrnuje chválu, povrchní kouzlo , povrchní sympatie ( krokodýlí slzy ), nadměrné omlouvání, peníze, souhlas, dary, pozornost, mimiku jako vynucený smích nebo úsměv a veřejné uznání.
Negativní posílení : může zahrnovat odstranění jednoho z negativní situace
Přerušované nebo částečné posilování : Částečné nebo přerušované negativní zesílení může vytvořit účinné klima strachu a pochybností. Částečné nebo přerušované pozitivní posílení může oběť povzbudit k vytrvalosti - například u většiny forem hazardu hazardní hráč pravděpodobně znovu a znovu vyhraje, ale celkově stále přijde o peníze.
Trest : zahrnuje otravování , řvaní, tiché zacházení , zastrašování , vyhrožování, nadávky , citové vydírání , výlet za vinu , trucování, pláč a hraní na oběť .
Traumatické učení na jednu zkoušku: pomocí verbálního zneužívání , výbušného hněvu nebo jiného zastrašujícího chování k získání nadvlády nebo nadřazenosti; dokonce i jeden incident takového chování může oběti podmiňovat nebo vycvičit, aby se vyhnuli rozčilení, konfrontaci nebo kontradikci manipulátora.

Traumatické lepení

Traumatické svazování nastává v důsledku pokračujících cyklů zneužívání, ve kterých přerušované posilování odměny a trestu vytváří silná emocionální pouta, která jsou odolná vůči změnám.

Druhý zdroj uvedl, že „Nutnými podmínkami pro traumatické svazování je, že jedna osoba musí ovládat druhou a že úroveň zneužívání chronicky narůstá a pak ustupuje. Vztah je charakterizován obdobími tolerantního, soucitného a dokonce láskyplného chování dominantní osoby, přerušovaného přerušovanými epizodami intenzivního zneužívání. Aby si oběti udržely navrch, manipulovaly s chováním oběti a omezovaly možnosti oběti, aby zachovaly nerovnováhu moci. Jakékoli ohrožení rovnováhy dominance a podrobení se může setkat se stupňujícím se cyklem trestů od vroucího zastrašování po intenzivně násilné výbuchy. Victimizer také izoluje oběť od jiných zdrojů podpory, což snižuje pravděpodobnost odhalení a zásahu, zhoršuje schopnost oběti přijímat vyrovnávací sebereferenční zpětnou vazbu a posiluje pocit jednostranné závislosti ... Traumatické efekty těchto zneužívajících vztahů může zahrnovat narušení schopnosti oběti přesného sebehodnocení, což vede k pocitu osobní nedostatečnosti a podřízeného pocitu závislosti na dominující osobě. Oběti se také mohou setkat s řadou nepříjemných sociálních a právních důsledků jejich emocionální a behaviorální příslušnosti k někomu, kdo se dopustil agresivních činů, i když byli sami příjemci agrese. '.

Videohry

Většina videoher je navržena kolem smyčky nutkání a přidává určitý druh pozitivního posílení prostřednictvím rozvrhu s proměnlivou sazbou, aby hráč mohl hrát. To může vést k patologii závislosti na videohrách .

Jako součást trendu v monetizaci videoher v průběhu roku 2010 některé hry nabízely loot boxy jako odměny nebo jako položky zakoupitelné z fondů reálného světa. Krabice obsahují náhodný výběr položek ve hře. Tato praxe je svázána se stejnými metodami, které výherní automaty a další hazardní zařízení rozdávají odměny, protože se řídí plánem s proměnlivou sazbou. Přestože obecný dojem, že loot boxy jsou formou hazardu, je tento způsob klasifikován pouze v několika zemích. Metody používání těchto položek jako virtuální měny pro online hazardní hry nebo obchodování s penězi v reálném světě však vytvořily trh s hazardními hrami na kůži, který je pod právním hodnocením.

Kultura strachu na pracovišti

Ashforth diskutoval o potenciálně destruktivních stránkách vedení a identifikoval to, co označoval jako drobné tyrany : vůdce, kteří uplatňují tyranský styl řízení, což má za následek atmosféru strachu na pracovišti. Částečné nebo přerušované negativní zesílení může vytvořit efektivní atmosféru strachu a pochybností . Když zaměstnanci získají pocit, že jsou tyrani tolerováni, může to mít za následek atmosféru strachu.

Jednotlivé rozdíly v citlivosti na odměnu , tresty a motivaci byly studovány v rámci teorie citlivosti posilování a byly také použity na výkon na pracovišti .

Jedním z mnoha důvodů navrhovaných pro dramatické náklady spojené se zdravotní péčí je praxe obranné medicíny. Prabhu recenzuje článek Cole a diskutuje o tom, jak jsou reakce dvou skupin neurochirurgů klasickým operantním chováním. Jedna skupina cvičí ve státě s omezením soudních sporů a druhá skupina bez omezení. Skupina neurochirurgů byla anonymně dotazována na své cvičné vzorce. Lékaři změnili svou praxi v reakci na negativní zpětnou vazbu (strach z soudních sporů) ve skupině, která praktikovala ve státě bez omezení lékařských soudních sporů.

Viz také

Zneužívající síla a kontrola
Testování na zvířatech
Behaviorální kontrast
Behaviorism (obor psychologie odkazující na metodologický a radikální behaviorismus)
Modifikace chování (starý výraz pro ABA; modifikuje chování buď prostřednictvím následků, aniž by zahrnovalo kontrolu stimulů, nebo zahrnuje použití záplav - také se nazývá terapie dlouhodobou expozicí )
Cukr a bič
Péče o dítě
Kognitivismus (psychologie) (teorie vnitřních mechanismů bez odkazu na chování)
Testy spotřebitelské poptávky (zvířata)
Vzdělávací psychologie
Vzdělávací technologie
Experimentální analýza chování ( principy experimentálního výzkumu v operantním a respondentském podmiňování)
Expoziční terapie (také nazývaná desenzibilizace)
Odstupňovaná expoziční terapie (také nazývaná systematická desenzibilizace )
Habituace
Jerzy Konorski
Naučil se pracovitosti
Odpovídající zákon
Negativní (pozitivní) kontrastní efekt
Radikální behaviorismus (koncepční teorie analýzy chování, která rozšiřuje behaviorismus a zahrnuje také soukromé události (myšlenky a pocity) jako formy chování)
Posílení
Pavlovian-instrumentální přenos
Preference testy (zvířata)
Předem připravený princip
Senzibilizace
Sociální podmiňování
Společnost pro kvantitativní analýzu chování
Spontánní zotavení

Reference

{78} Alexander BK (2010) Addiction: The View from Rat Park, retrieved from Addiction: The View from Rat Park (2010)

Languages

In other projects