Inlärningsteorier

Pavlov, Watson, Thorndike och Skinner



Kontiguitetsteorier=samtidighetsteori inom konnektionismen=sambandsteorin Behaviorismen=beteendet, (inriktar sig på studier av hur individen reagerar på olika stimuli.)

Pavlov

Sysslade med forskning om klassisk betingning.
Vårt beteende byggs upp av betingade reflexer=responser som vi lärt in,( kallas för klassisk betingning.)
Klassisk betingning=En retning (stimulus) som ex. mat tillsammans med ett inlärt (betingat) beteende ex. fotsteg utlöser en retning (obetingad) respons hunger, som i sin tur ger en inlärd (betingad) respons i form av salivavsöndring.
Utsläckning=Om retningen och den efterföljande inlärda stimulus försvinner samtidigt (kontiguitet) så upphör beteendet och det sker en utsläckning.

Watson

1878-1958 filosofie dr. i psykologi
studerade råttors inlärning i en labyrint, när man studerar djurs beteende kan man helt bortse från medvetandet (fantasins rike) och bara studera vad dom gör.
  • Vi föds med vissa stimulus-respons-förbindelser sk. reflexer, ex. nysning, sparkreflexer.
  • Vi bygger upp nya s-r-f genom betingning.
  • Vi har tre medfödda mönster för emotionella reaktioner fruktan, vrede, och kärlek.
Fast dessa etiketter refererar till rörelsemönster, inte till några slags medvetna känslor.
Om vi slår på en gonggong bredvid ett barn, och det börjar skrika är det som hänt sålunda att stimulus av ett starkt ljud producerat emotionen rädsla.
Vi har gett ett namn åt det beteende vi kan se inte någon kommentar om barnets eventuella känslor.
Emotionell inlärning innebär att man betingar dessa tre mönster för emotionell reaktion på nya stimuli.
(rädsla förändras från obetingad stimulus till betingad stimulus.)

Däremot kan vi bygga upp en mångfald av nya s-r-f genom just betingning.
Vi lär oss reagera på nya situationer genom att varje respons i den ursprungliga reflexreportaren så småningom kan utlösas av en väldig mångfald nya stimuli utöver dem som ursprungligen utlöste den.
Vi måste inte bara lära oss att reagera på nya situationer, utan också lära oss nya responser.

Hur lär man då nya vanor? Genom att bygga upp serier av reflexer.
Att gå: förnimmelser hopkopplas med responsen vilket utlöser en betingad reflex att sätta det ena benet framför det andra.
Detta är en serie reflexer där var och en åstadkommer en stimulus för nästa svar.

Varför utlöser förnimmelsen responsen? Stimulus-respons-förbindelser som bildar den inlärda handlingen är betingade reflexer.
Frekvensprincipen säger att ju oftare vi reagerar med en bestämd respons på en bestämd stimuli desto troligare blir det att vi kommer att svara på samma sätt på samma stimuli även i fortsättningen.
Principen om temporal närhet säger att ju kortare tid som har förflutit sedan vi senast reagerade med en viss respons på en viss stimuli, desto troligare blir det att vi svarar på samma sätt igen.
Kunskapsinhämtandet är en process där man lär sig ge den rätta serien ord som respons på en fråga eller någon annan betingad stimulus.
Allt vårt beteende involverar hela kroppen, och därför kan vi lugnt påstå att känslorna är responser från inälvorna och att tänkandet består av vokala responser.
Allt vi tänker, känner, säger eller gör inbegriper, i varierande grad verksamhet från hela kroppens sida.
Detta är förmodligen behaviorismens allra mest grundläggande fakta.


Thorndike


konnektionistisk förstärkningsteoretiker 1874-1949 objektiv psykolog.
införlivade effektlagen med den objektiva inlärningspsykologin, den förste förstärkningsteoretikern.
(vi gör gärna sådant som ger oss välbehag och undviker sånt som bereder oss smärta)
Hans viktigaste inlärningslag var effektlagen.
Denna utsäger att inpräglingen av stimulu-respons-förbindelserna beror inte bara på det faktum att stimulus och respons är simultana, utan också på de effekter som följer på responsen.
Om en stimulus följs av först en respons och sedan av en tillfredställelse förstärks stimulus-respons reaktionen.
Men om stimulus följs av först en respons och sedan obehag, då försvagas i stället stimulus-respons-reaktionen.
Alltså är det responsernas positiva eller negativa effekt som avgör om stimulus-respons-förbindelserna skall präglas in eller plånas ut.

Skinner


konnektionistisk teoretiker som understryker förstärkningens roll som en grundläggande faktor vid inlärning.
Skinner skiljer på två olika slag av inlärning.
  • Respondent beteende: utlöses av bestämda stimuli. Är bara stimulus närvarande så uppträder responsen automatiskt. (uppträder som svar på stimuli) Respondent beteende utgörs av sådana specifika stimulus-respons-förbindelser sk. reflexer.(klassisk betingning hos Watson) Betingad reflex=inlärd handling (responser vi lärt in)
  • Operant beteende: beteendet aktivt riktar sig mot miljön, snarare avges av organismen än utlöses av stimuli. Och huvudparten av allt beteende tillhör denna grupp - gåendet, talandet, arbetet och leken är samtliga sammansatta operanta responser. Inlärning av ett operant beteende kallas också för den för betingning. Om operant respons uppträder och följs av en förstärkning, då ökar sannolikheten för att den skall uppträda på nytt.
Negativa förstärkare menas aversiva retningar, sådana som individen normalt söker undvika.
  • Negativ förstärkning, förstärker genom sitt försvinnande t.ex. en elektrisk chock.
  • Positiv förstärkning, förstärker genom sitt uppträdande.
En respons kan alltså förstärkas antingen genom att en
  • positiv förstärkare presenteras eller genom att en
  • negativ förstärkare avlägsnas.
Negativ förstärkning uppträder om man avlägsnat en negativ förstärkare, medan bestraffning innebär presentation av en negativ förstärkare.

Vilka verkningar får då bestraffningen och hur åstadkoms dessa verkningar?
1. Den aversiva stimulus som används som bestraffning får emotionella effekter.
(straffar ett barn för att det ätit förbjudet godis, barnet skriker av emotionell känsla, det slutar äta för det kan inte skrika samtidigt denna verkan är dock bara temporär).
När den aversiva stimulus avlägsnas skingras snart de emotionella verkningarna. Därefter uppträder det bestraffade beteendet på nytt, ofta i ännu starkare grad.
Alltså hejdar icke önskvärt beteende men verkningslöst när det gäller att förhindra att det uppträder på nytt.

2. När en neutral stimulus sammanparas med en aversiv stimulus som utlöser en respondent, innebär detta en betingningsituation.
Detta innebär att envar stimuli som är närvarande när bestraffningen sker får en chans att bli en betingad stimulus för de emotionella responserna på bestraffningen.
(Barnet skulle tendera att känna ångest) (åstadkomma emotionella responser) så snart det rörde vid de förbjudna sötsaker som tidigare sammanparats med bestraffningen. Ångesten skulle hämma dess ätrespons.

3. När individen avlägsnar sig från de betingade aversiva stimuli, avlägsnar detta dessa stimuli och åstadkommer negativ förstärkning.
Individen förstärks sålunda att avge en respons (avlägsna sig).
I och med att stimuli från de förbjudna sötsakerna blev aversiva för barnet innebar detta en förstärkning för allt som förde det bort från dessa stimuli.
Och eftersom detta att avlägsna sig från dessa stimuli är oförenligt med att närma sig dem, lärde sig barnet sålunda att inte äta de förbjudna sötsakerna.
Denna effekt varar bara intill dess den betingade motvilja som stimulus uppväcker har upphört.
Slutligen kan de emotionella svaren mycket väl betingas till andra stimuli än de som den bestraffande vill betinga dem till, inklusive den stimulus som utgörs av bestraffaren själv.

Stimulus uppgift
Kan avgöra om en given operant ska uppträda eller inte.
En stimulus förvärvar denna förmåga genom en diskrimineringsprocess.

Hur bildas en diskriminering?
Om en operant förstärks i närvaro av en stimulus men inte förstärks av en annan, utplånas tendensen att avge respons när den andra stimulus är närvarande.
Operanten uppträder i fortsättningen i närvaro av den första men inte den andra (skinner betecknar första med S D) (den andra med val, eller andra aspekter på det operanta beteendet).
Skinner studerar responsfrekvenser vilken variabel de än förändrar.
Det gäller att finna en lämplig operant för den individ man vill studera, det vill säga en operant som subjektet kan avge bekvämt och snabbt.
Responsfrekvensen (den beroende variabeln) kan relateras till en mångfald av oberoende variabler.
Som bl.a förstärkningsschemat som betecknar det sätt varpå förstärkarna följer på responserna.
Det enklaste scemat är den kontinuerliga förstärkningen där en förstärkare ges för varje respons på manipulandum.
Detta används när försöksdjuret tränas i att använda manipulandum.
Sedan responsen lärts in, växlar schemat över till någon form av partiell förstärkning, där bara en del av responserna följs av förstärkare.

Det finns två grundläggande mönster.
  • Intervallsförstärkning beror helt enkelt på tidens gång
  • proportionell förstärkning=Om den frekvens varmed förstärkarna presenteras beror på responsfrekvensen, får man proportionell förstärkning.
Båda dessa kan vara regelbundna eller variabla, kombinerar man dessa klassifikationsgrunder får man fyra olika huvudtyper av scheman.
  • Regelbunden proportionell förstärkning förstärks försökspersonen efter ett bestämt antal responser.
  • Variabel proportionell förstärkning förstärkaren här ges inte konsekvent efter ett visst antal responser, utan i stället efter ett varierande antal sådana.
  • Regelbundet intervallsschema bestämd tidsintervall förflyta sedan en förstärkare levererats innan en ny kan erhållas.
  • Variabelt intervallsschema gör det möjligt att erhålla en förstärkning ibland snabbare och ibland längre tid efter närmast föregående.
Hur skiljer sig dessa scheman från varandra i fråga om responsfrekvensen?
Proportionella scheman ger högre respons än intervallsscheman.
Snabba responser på ett proportionellt förstärkningsschema ökar antalet förstärkningar under en bestämd tidsperiod, medan snabba svar på ett intervallschema innebär att försöksdjuret får varje förstärkning litet snabbare.
Båda de proportionella scheman avger en "tandad" effekt, där responsen avges långsamt efter en förstärkning men sedan går allt snabbare ända tills nästa förstärkning ges.
Vid ett regelbundet proportionellt förstärkningsschema förstärks de första responserna efter en förstärkning aldrig lika snabbt som de som kommer senare, och följden blir att de uppträder i långsammare takt.
Vill man uppnå en snabb och stadig responsfrekvens och hög resistens mot utsläckning, är ett variabelt oregelbundet förstärkningsschema det effektivaste.
(ett djur kan arbeta för att få föda så hårt att det i realiteten opererar på biologisk förlustbasis, den energi det lägger ner för att få mer är större än den föda det får och bokstavligen kan djuret arbeta ihjäl sig.)

Tillämpningsområden
Formning=(djurdressyr) Är den teknik skinner använder för att utbilda djur att utföra komplicerade handlingar som ligger utanför deras normala beteendenivå.
Beteendet formas genom en serie av successiva apptoxinationer, där var och en möjliggörs genom en selektiv förstärkning av vissa responser på bekostnad av andra.
På så sätt förs beteendet gradvis allt närmare det önskade mönstret.
(en råtta lär sig få mat genom att trycka på en spak, sedan måste han först trycka sedan läggs nya måsten till hela tiden för att få maten).
vidskepligt beteende=Icke planerad inlärning genom en tillfällig förstärkning.
(en student har en hartass till tentan som lyckas, därför tror han att tassen gav tur och sannolikheten för att den är med nästa gång ökar). Ur detta stegras hans beroende av tassen som lyckobringare allt mer.

Programmerad undervisning=En serie kombinerade undervisnings- och testenheter som stegvis för eleven genom det material som ska läras in.
Mest känd genom sitt användande i sk. inlärningsmaskiner.

Undervisningsteknologi=i detta fallet ett verbalt beteende skall formas. Stegvis från välkänt till okänt material, lära sig de nödvändiga diskrimineringarna (skillnaderna) och förstärkas.
Ett tempo lagom för den ena passar inte den andra, möjlighet att avge responserna är begränsade och förstärkningen blir fördröjd.
Svaret är individuell undervisning, men det är praktiskt ogenomförbart, så vad göra?
Maskinens grundläggande komponent är programmet, det består av en serie kombinerade undervisnings och testenheter som för eleven steg för steg genom det material som ska inläras.
Elev kan direkt kolla svaret, vid rätt svar förstärkning vid fel svar möjlighet att se det rätta ökar sin möjlighet till förstärkning nästa gång.

Beteendemodifikation=avslappningsträning, fobiträning och kognitiv terapi/positivt tänkande en teknik som används är Verbal betingning=påvisar förstärkningens automatiska påverkan på det mänskliga beteendet.

Maskinen då?
Dessa programmerade arbetsböcker sköter hela undervisningen med hjälp av programmets enheter.
Samma serie enheter som åstadkommer elevens responser, ger också de informationer som krävs för att han skall kunna avge dessa responser.
Vilket i sin tur ställer stora krav på programmakarna som måste planera serien av enheter utifrån vad han önskar att eleven skall lära in, och hur detta kan presenteras på bästa sätt.
Maskinen har vissa fördelar den ökar takten i förstärkningen, och minskar möjligheten till fusk.
Maskinens nyhetsverkan gör också att den är en förstärkning i sig på eleven.
Maskinen själv är ett tvistefrö mellan de som vill satsa på ökad effektivitet kontra personliga värden i undervisningen.
Detta är att placera tonvikten fel då den avgörande frågan gäller det eventuella värdet hos programmerade undervisningsmetoder i vilken form dom än presenteras och inte hos inlärningsmaskiner som sådana.

© Ingegerd Persson