UPPSALA UNIVERSITET
Institutionen för psykologi
Vårterminen 1999
C-uppsats, 10 p.

TAT
och
INTERBEDÖMARRELIABILITET
Jenny Hultström

 

Handledare: Bo Ekehammar
Bitr. handl.: Sophia Marongiu

Georgios Rigas

Examinator: Erik Börjesson

 

Sammanfattning

Uppsatsen behandlar interbedömarreliabiliteten hos TAT (Thematic Apperception Test). TAT är en metod att mäta omedvetna motivationsbehov, vanligtvis motivationsbehoven Prestation, Relation och Makt. Ett av problemen med denna typ av testning har varit just interbedömarreliabiliteten, dvs huruvida olika bedömare överensstämmer i sin poängsättning av respektive testdeltagare. Interbedömarreliabiliteten granskas på fyra olika nivåer, för att kartlägga var eventuella problem är lokaliserade och utifrån detta rekommendera lämpliga åtgärder. För studien genomfördes en TAT-testning av 48 kvinnor och män. Materialet kodades enligt Atkinsons manual av två oberoende bedömare. Resultatet visade att interbedömarreliabiliteten över lag var mycket hög. De brister som fanns stod att finna främst vid kodningen av prestationsbehovet. Dessa bedöms ändå som relativt obetydliga, varför inga direkta åtgärder kan rekommenderas. Sammanfattningsvis visar resultaten från denna undersökning att interbedömarreliabiliteten inte är något problem vid denna typ av testning, så länge kodningsförfarandet utförs av tränade bedömare.

                                Nyckelord: Motivation, TAT, Prestation, Relation, Makt.

 

Inledning

Introduktion till motivationsforskningen

Alla människor har olika drivkrafter inom sig som påverkar valet av handlingar i olika situationer. Människans handlingar är sällan slumpmässiga, utan riktas av hennes inre drivkrafter, hennes motivationsbehov, mot vissa mål. En del människor kan t.ex. vara prestationsinriktade, vilket betyder att deras behov att göra bra ifrån sig utlöses lättare än andras, andra människor kan vara mer inriktade på att etablera goda förhållanden mellan människor, dvs de bär på en starkt relationsbehov. Beroende på hur en individs motivationsbehov ser ut, uppfattar hon situationer på olika sätt och agerar därefter. Om man känner till motivationen hos en människa, kan man eventuellt predicera hennes sannolika handlingsmönster och reaktioner i särskilda situationer (t.ex. McClelland, 1989). Kännedom av människans kommande handlande och förmågan att förutsäga beteendemönster är relevant inom oräkneliga områden. Därför efterfrågas bra instrument för att mäta just motivationsbehov. Således har motivationsforskningen, och kanske särskilt utformandet av olika metoder för att mäta människors motivation, sysselsatt åtskilliga psykologer och andra genom åren. Motivationsforskningen har ansetts särskilt intressant i bl.a. organisations- och rekryteringssammanhang, eftersom man här ofta försöker fastställa människors egenskaper och predicera kommande handlingsmönster och yrkesframgångar.

Under 1930-talet inledde den amerikanske psykologen Henry A. Murray (1893-1988) utvecklandet av en nydanande teori kring mänsklig motivation. Murray definierade människans personlighet i termer av individuella skillnader i motivuppsättning, vilket betyder att varje människa bär på ett antal ärvda eller förvärvade behov. Motiven definieras som varaktiga personlighetsdrag, vilka fungerar som organiserande krafter som vägleder mentala, verbala och fysiska processer längs en särskild kurs (McClelland & Koestner, 1989). Murray menade att många av våra behov är icke-medvetna, ofta tillfredsställer vi våra behov utan att ens vara medvetna om processen. Grundläggande för teorin är tanken att motivuppsättningen varierar mellan människor. Beroende på hur motiven är utformade aktiveras antingen ett närmande eller ett undvikande beteende. En situation utlöser alltså närmande eller undvikande beroende på vilket motiv som är det dominerande hos människan i den aktuella situationen, och beroende på hur motivet i sig ser ut. Detta är ett manifest beteende med det specifika syftet att upprätthålla positiv stimulering genom närmande, och ta bort negativ stimulering genom undvikande. På detta sätt ger motiven faktiska konsekvenser i en människas beteende; de orienterar och väljer beteendet, de riktar uppmärksamheten mot vissa stimuli i omgivningen och inte andra, de verkar för inlärning av material som är relevant för motivet ifråga, de aktiverar responser som är nödvändiga eller framgångsrika för att nå målet, dvs undvikandet eller närmandet. Behoven är dock inte aktivt verkande förrän de väcks av utlösande faktorer i situationen personen ställs inför. (Geen, 1995).

Murrays stora bidrag till motivationsforskningen var utvecklandet av ett nytt mätinstrument för att mäta motiv, Thematic Apperception Test (framöver förkortat TAT). Testet består av en serie bilder, vilka föreställer aktörer i tvetydiga situationer. Personen som testas ombeds berätta en kort historia till varje bild. De fantasier som framkommer i historierna avslöjar, enligt teorin, personens motivation i form av dennes dagdrömmar, fantasier, orientering och ambitioner. P.g.a. tvetydigheten i bilderna antas nämligen innehållet i historierna främst vara baserat på fantasier och behovsrelaterade tankar hos personen själv snarare än på egenskaper hos bilden. Det sker alltså en projicering av personens inre behov och sätt att uppfatta omgivningen till de fantasier som bilderna utlöser hos personen i fråga. Genom att koda historierna utifrån vissa framarbetade manualer får man således ett mått på personens behovsnivå beträffande de olika motiven. På detta sätt erbjuder TAT ett fönster till människans icke-medvetna motivationsstrukturer. Eftersom Murray (1938) ansåg att människans motiv inte ligger på en för henne medveten nivå, var denna nya typ av mätmetod nödvändig för motivationsforskningen. I tidigare metoder har motiven antagits vara medvetna, vilket lett till slutsatsen att människan själv kan redogöra för sin motivation. Enligt Murray mäter dessa direkta typer av mätningar, som t.ex. formulär, snarare personens självbild och värderingar (values), och inte hennes motivationsbehov (Murray, 1938).

Vid Murrays studier riktades uppmärksamhet på 40 olika motiv, varav majoriteten av dessa inte längre anses relevanta och studeras därför inte. Tre motiv har dock överlevt och fått ökat intresse under de 60 år som gått sedan Murray först presenterade teorin; motiven Prestation (achievement), Relation (affiliation) och Makt (power).

Murrays teorier har vidareutvecklats av bl.a. de amerikanska psykologerna David McClelland och John Atkinson., vilka införlivade TAT i deras generella motivationsteori. Till skillnad från Murray förkastade de tanken att motiv endast finns på en icke-medveten nivå hos människan (McClelland, Koestner & Weinberger, 1989). De motiv som Murray definierade som icke-medvetna, är enligt McClelland m.fl. endast en aspekt av den mänskliga motivationen. McClelland m.fl. benämner denna aspekt implicit motivation. Vid sidan av de implicita motivationsbehoven finns en annan typ av behov, de självattribuerade. Dessa är av medveten karaktär, följaktligen kan personen själv beskriva dem och de kan därmed mätas på medveten nivå. För att underlätta för läsaren används fortsättningsvis namnen Implicit Motivation för de icke-medvetna behoven, och Explicit Motivation för de självattribuerade, medvetna behoven.

Implicit och explicit motivation är med andra ord två kvalitativt skilda typer av motivation, som båda influerar beteende fast på olika sätt. De implicita behoven är, enligt McClelland et al (1989), mer tillförlitliga när det gäller att predicera beteendemönster över längre tidsperioder, medan de explicita behoven bättre förutsäger beteende i den omedelbara framtiden, som valsituationer eller attityder. De båda typerna av motivation utlöses av olika slags stimuli i omgivningen. Explicit motivation utlöses av situationer där relevanta sociala incitament finns närvarande, och finner tillfredsställelse i den känsla av status, självförverkligande eller annat positivt som följer när uppgiften redan är slutförd. Primärt för explicita motiv är att framstå som något, t.ex. kompetent och kunnig. Den implicita motivationen drivs av tillfredsställelsen i själva utförandet av en uppgift, och är inte kopplad till någon extern belöning som följer av aktiviteten (McClelland et al., 1989). Implicit motivation kopplas istället ihop med genuint intresse för arbetsuppgiften. Man har även funnit stöd för att de olika typerna av motivation förvärvas på olika sätt och vid olika tidpunkter i livet (McClelland et al., 1989).

Implicita motiv mäts vanligtvis med projektiva metoder, t.ex. TAT, medan explicita motiv mäts med sk självrapporterade formulär, exempelvis Manifest Needs Questionnaire (förkortat MNQ). De olika metoderna mäter därmed två olika typer av motivationssystem, vilka inte ens behöver korrelera med varandra (t.ex. McClelland & Koestner, 1989). Mätningar av implicita motiv erbjuder en generell orientering av människans mål, explicita motiv reflekterar hennes sociala normer som i sig hjälper att mer precist definiera inom vilket område målen förverkligas i (t.ex. McClelland, 1985). Det är därför mycket användbart att mäta både explicit och implicit motivation om man vill förutspå beteende, eftersom den explicita motivationen ofta ger specifik riktning åt de implicita motiven (McClelland, Koestner & Weinberger, 1989). Både Murray och McClelland m.fl. betonar dock att de underliggande motivens roll bäst identifieras om man studerar en individs beteende över en längre tid (McClelland & Koestner, 1989).

I studier har det framkommit att personer med ett högt prestationsbehov generellt är bättre i prestationsinriktade aktiviteter jämfört med personer med lågt prestationsbehov (se t. ex. Madsen, 1974; Sheppard & Belitsky, 1966). Detta är så väl etablerat att TAT-mätningar av implicita motivationsbehov anses vara den i särklass bästa metoden att mäta och förutsäga verkligt utförande i prestationsinriktade aktiviteter (Sorrentino & Higgins, 1986). För övrigt är TAT såväl ett av de mest använda projektiva testerna i USA som det mest frekvent utlärda projektiva instrumentet i USA (Piotrowski & Keller, 1984).

McClelland har utvecklat en modell, the Leadership Motive Pattern (LMP), för att predicera framgång hos företagsledare (Jacobs & McClelland, 1994). LMP är en modell över hur en ledares implicita motivationsbehov, mätt via TAT, bör vara kombinerade. Modellen visar att ett starkt maktbehov, ett svagt relationsbehov samt ett högt "Activity inhibition" är ett önskvärt motivationsmönster för personer på ledande positioner. Studier har visat att de ledare vars motivationsmönster motsvarar LMP-modellen dels genererar högre moral hos sina underordnade (Winter, 1991), samt når högre chefsnivåer jämfört med ledare som inte innehar mönstret ifråga (Jacobs & McClelland, 1994).

Problem med TAT-metoden

Som framgått ovan styrker åtskilliga studier antagandet att implicit och explicit motivation är två kvalitativt olika aspekter av motivation (se t.ex. McClelland, 1953), samt att det är viktigt att inte sammanblanda dessa (McClelland, Koestner & Weinberger, 1989). Trots detta har många ansett att distinktionen mellan implicit och explicit motivation är onödig och förvirrande och valt att istället ignorera den kvalitativa skillnaden dem emellan. Att mätningar av explicita och implicita motiv inte nödvändigtvis korrelerar, vilket enligt McClelland et al (1989) bevisar att de är två oberoende motivationssystem, har bl.a. bemötts med reaktionen att projektiva mätningar av motivation inte mäter någonting alls (Entwisle, 1972), eller med slutsatsen att mätinstrumentet vid direkta mätningar inte designats riktigt, men att implicita motiv går att mätas genom direkt metod. Flera forskare har således försökt skapa ett formulär för att mäta implicit motivation (exempelvis Raven, Molloy & Corcoran, 1972), men ingen har lyckats få fram något som konsistent korrelerar med TAT (McClelland, Koestner & Weinberger, 1989). Trots bristen på korrelation med TAT har man valt att behandla resultaten från de direkta mätningarna som om det vore mätningar av implicit motivation (McClelland & Koestner, 1989).

Förutom rent praktiska anledningar, som kostnad och tid, har TAT-metoden kritiserats beträffande att testet vid studier har uppvisat låg test-retest-reliabilitet, dvs att personer som testats inte uppvisat samma resultat från en mätning till en annan. Kritiken har avvisats med att test-retest-reliabiliteten har acceptabelt hög nivå om mätningarna hanteras under standardiserade förhållanden samt att instruktionen till den andra mätningen uttryckligen framhåller att det är tillåtet att skriva samma eller liknande historia som vid det första testtillfället (McClelland & Koestner, 1989).

Ett annat problem beträffande användandet av TAT-testning, liksom andra projektiva tester, är den låga interbedömarreliabiliteten som kan förekomma. I en aktuell svensk studie (Börjesson, 1996) var interbedömarreliabiliteten endast 0.67 för prestationsmotivet, 0.30 för relationsmotivet samt 0.53 för maktmotivet. Ett sådant resultat sätter hela testets trovärdighet i gungning. Om det vore så att värdet på en försökspersons nivå för ett visst motiv beror på vem som bedömer hans/hennes historier, vet vi egentligen ingenting om personens verkliga motivationsnivå, vilket i sig gör hela testet överflödigt. Att interbedömarreliabiliteten är hög är en förutsättning om man ska använda sig av metoden. Acceptabel nivå på korrelationen mellan bedömarna anses ligga på 0.7, men ju högre korrelationen är desto säkrare är resultatet.

Syfte

Syftet med denna studie är att granska och uppskatta interbedömarreliabiliteten av implicit motivation, dels för att kartlägga problemet med låg interbedömarreliabilitet och dels för att komma fram till vilka eventuella åtgärder som skulle kunna vara lämpliga.

Granskningen av interbedömarreliabiliteten kommer att ske på fyra nivåer;

1. Hur hög är överensstämmelsen mellan bedömare vad gäller totalpoäng för de olika motivationsbehoven?

2. Hur hög är överensstämmelsen mellan bedömare vad gäller förekomst / ej förekomst av respektive motivationsbehov per bild?

3. Hur hög är överensstämmelsen mellan bedömare vad gäller graden av motivationsbehov för respektive bild?

4. Hur hög är överensstämmelsen mellan bedömare vad gäller förekomst / ej förekomst av olika underkategorier inom respektive motivationsbehov per bild?

Genom att analysera eventuella skillnader beträffande interbedömarreliabiliteten i dessa fyra nivåer blir det lättare att upptäcka möjliga brister i kodningen. Om skillnaderna mellan de olika nivåerna eller mellan olika underkategorier är stora diskuteras möjliga åtgärder. Dessutom kommer en jämförelse mellan de tre olika motivationsbehoven prestation, makt och relation att utföras, för att reda ut om något av motiven är svårare att koda jämfört med de andra.

Metod

Deltagare

I undersökningen ingick 48 deltagare, 24 män och 24 kvinnor. Dessa nåddes via listor, personliga kontakter samt via institutionen för psykologi. Åldern hos deltagarna varierade mellan 19 och 58 år, med en medelålder på 28 år. Sjutton av deltagarna förvärvsarbetade, medan övriga 31 var studerande vid Uppsala universitet. Sjutton av de studerande läste, eller har läst vid Institutionen för psykologi.

Femton av deltagarna erhöll någon form av belöning. Denna belöning var antingen i form av en biobiljett (10 st) eller som ett skriftligt intyg om deltagandet i försöket (5 st). Det senare gäller beträffande studerande på psykologins A-kurs. För 9 personer, som vid testtillfället läste psykologins B-kurs, ingick deltagande i undersökningen i deras undervisning i testteori.

Procedur

För att mäta den implicita motivationen användes ett särskilt datorprogram, utformat för denna undersökning (Marongiu & Rigas, 1996). Datorprogrammet innehåller instruktioner, bildmaterial, särskilt utrymme att skriva historier på, samt frågor som deltagaren i sina historier skall försöka besvara. Bildmaterialet om sammanlagt 16 bilder bestod av McClellands ursprungliga 6 bilder från hans studier i arbetsprestation, 6 hämtade från Murrays orginalbilder, och fyra konstbilder av Matisse och Hockney (se Bilaga 1 för översikt av bildmaterialet). De fyra konstbilderna var i färg, medan de övriga 12 bilderna endast var svartvita. Konstbilderna exkluderades ur denna studie, eftersom de inte var relevanta för syftet.

Testet bestod för varje deltagare av två moment, en direkt mätning där personen fick fylla i ett formulär, och en indirekt där TAT-mätningen ägde rum. Ordningen på dessa två moment randomiserades så att varannan deltagare i undersökningen inledde testet med det första, och varannan började med det andra momentet. Efteråt ombads deltagaren fylla i en explicit skattning av bildmaterialet. Denna skattning ägde alltid rum sist i försöket. Formuläret avsåg att mäta deltagarens explicita motivation. Dessa resultat, samt bildskattningarna, redovisas dock ej i uppsatsen då de inte omfattas av problemställningen (se Braun, 1998).

Datorprogrammet för TAT-mätningen inleddes med följande instruktion till deltagaren:

Instruktioner:

Du kommer nu att få se några bilder och till varje bild ska Du skriva en berättelse utifrån de instruktioner Du finner efter varje bildpresentation. Klicka på fortsätt när du vill börja.

Efter detta exponerades bild för bild i randomiserad ordning. Varje bild visades under 10 sekunder, varpå frågor följde samt ett öppet fält där deltagaren skulle skriva ner sin fantiserade historia. Deltagaren fick skriva sina historier på valfri tid. Instruktionerna till varje bild löd:

Skriv en kort berättelse på utrymmet nedan utifrån följande ledfrågor:

· Vad händer?

· Vilka är personerna på bilden?

· Vad har lett fram till situationen?

· Vad har hänt i det förflutna?

· Vad tänker de?

· Vad vill de?

När du har skrivit färdigt din berättelse kan du klicka på OK.

Av de 48 deltagarna var det endast hälften som exponerades för samtliga 16 bilder, då de fyra konstbilderna endast var att betrakta som ett explorativt moment i undersökningen. Samtliga deltagare fick dock se och skriva berättelser till McClellands och Murrays bilder. Vilka deltagare som skulle exponeras för alla 16 bilder slumpades fram.

Databearbetning

Materialet från de indirekta mätningarna, dvs deltagarnas bildhistorier, kodades av två oberoende bedömare, vilka använde sig av Atkinsons kodningsmanual (Atkinson, 1958). För att bedömarna riktigt skulle förvärva tillräcklig insikt i manualens uppbyggnad ägnades ett omfattande förarbete till att studera manualen och utbildas av en lärare, varpå de sedan tillämpade kunskaperna på övningsexempel med mall (Atkinson, 1958), samt på pilotfall som efteråt diskuterades. Pilotfallen användes inte i undersökningen. När bedömarna, oberoende av varandra, kodat 25 % av undersökningsmaterialet ägde en sammankomst rum, där de två kodningarna jämfördes och diskuterades. Detta för att ytterligare kalibrera bedömarna inför den resterande kodningen. Under själva kodningen av materialet arbetade varje bedömare enskilt.

Kodningsförfarandet gick till på följande sätt. Först skall bedömaren avgöra om fantiserande kring ett visst motiv över huvud taget finns representerat i historien, sk Imagery. Historien tilldelas 1 poäng om Imagery finns, och 0 poäng om det inte finns. Endast historier där Imagery finns representerat kodas vidare på de nio underkategorierna. Nedan följer en mycket förkortad beskrivning av Atkinsons kodningsmanual.

Imagery för prestation: Någon aktör i historien vill göra bra ifrån sig, vilket kan yttra sig i deltagande i någon konkurrensaktivitet där vinna eller göra sitt bästa eller bättre än andra är ett uttalat mål. Det kan även handla om känslomässigt tillstånd beträffande prestation, som att känna sig stolt över en bra prestation, eller känna sig besviken över en dålig prestation. Fantasier kring prestation kan också inbakas i handlingen genom att någon aktör utmärker sig, presterar något unikt, eller på annat sätt har ett framgångsrikt liv.

Imagery för relation: Någon aktör i historien är intresserad av att etablera, bibehålla eller återupprätta ett positivt förhållande med annan/andra. Det kan handla om vänskap, men även att någon söker positiv respons och godkännande. Påståenden som vittnar om att någon tycker om någon annan, söker kontakt, vill bli förlåten, känslor kring relationer, liksom vissa kamratliga aktiviteter är tillräckligt för att koda relationsfantiserande.

Imagery för makt: Påståenden i historien vittnar om att någon aktör är intresserad av att vinna inflytande över andra. Detta kan yttra sig på flera sätt; direkt agerande för att påverka någon, t.ex. argumenterande eller maktutövande, känslor förknippade med kontroll, önskan att påverka någon, eller även lära ut något. Dessutom kodas fantiserande kring maktmotivet vid blotta nämnandet av en relation som, på ett intrapersonellt plan, präglas av ett maktförhållande. Exempel på detta kan vara chef - underordnad.

Underkategorier: Om det återfinns ett fantiserande kring de olika motiven, kodas historien vidare på nedanstående underkategorier. Precis som för Imagery, ges 1 poäng om underkategorin ifråga finns representerad och 0 poäng om den inte finns i historien. Slutpoängen per historia kan därav variera mellan 0 poäng (inget fantiserande alls) och 10 poäng (samtliga underkategorier finns representerade) för respektive motiv.

n Need (N). Uttalat påstående om en önskan att tillfredsställa motivationsbehovet ifråga, formulerat i termer som vill, hoppas, bestämt sig för, etc. kopplat med motivets mål.

n Instrumentell aktivitet (I). Öppen aktivitet av aktör som tyder på att något görs för att uppnå motivets mål. Aktiviteten måste uttrycka en strävan mot målet.

n Förväntat måltillstånd (Ga + och Ga -). En aktör förväntar sig en utkomst relaterat till motivets mål. Det kan vara en positiv förväntan (Ga +), där aktören ser fram emot att nå målet. Det kan även vara en negativ förväntan (Ga -), då aktören känner ängslan eller frustration för ett stundande misslyckande relaterat till motivationsmålet. Poäng kan tilldelas båda varianterna i en och samma historia.

n Hinder (Bp och Bw). Motivets mål hindras på något sätt. Hindret kan vara lokaliserat hos individen själv, sk personligt hinder (Bp), eller finnas i omgivningen (Bw). Båda typerna kan poängsättas i en och samma historia.

n Känslomässigt tillstånd (G + och G -). Denna underkategori kodas när det finns ett klart uttalat påstående om positiva (G +) eller negativa (G -) känslor associerade med motivsrelaterad aktivitet. Båda typerna av känslomässiga tillstånd kan poängsättas i en och samma historia.

 

Resultat

I Tabell 1 ges en översikt av i vilken utsträckning de 12 olika bilderna överhuvud taget utlöste fantiserande kring motivationsbehoven Prestation, Relation och Makt. Värdena i tabellen baserar sig på om någon av bedömarna givit poäng för att ett fantiserande kring motiven (Imagery) finns representerat i historien, och är beräknade i hur stor procent av deltagarna som uppvisat ett sådant fantiserande. Som framgår av tabellen utlöser de olika bilderna olika behov. De tre behoven varierar även inbördes beträffande antalet bilder som utlöst många responser. fyra bilder har aktiverat över 30 % av deltagarna att fantisera kring Prestation, Bild nr 1 (31 %), nr 4 (85.5 %), nr 5 (69 %) och Bild nr 12 (39.5 %). Beträffande fantiserande kring relation var bildantalet 6, Bild nr 2 (83.5 %), nr 7 (77 %), nr 9 (33.5 %), nr 10 (60.5 %), nr 11 (54 %) och Bild nr 12 (73 %). Fem bilder utlöste maktbehovet hos över 30 % av deltagarna, Bild nr 1 (52 %), nr 6 (54 %), nr 8 (46 %), nr 9 (64.5 %) och nr 10 (56.5 %).

Tabell 1
Imagery per bild, beräknat i procent av 48 deltagarna.

Bild

Prestation

Relation

Makt

1

31.5

29

52

2

8.5

83.5

16.5

3

25

19

29

4

85.5

8.5

21

5

69

14.5

6.5

6

6.5

25

54

7

2

77

10.5

8

12.5

23

46

9

10.5

33.5

64.5

10

8.5

60.5

56.5

11

2

54

14.5

12

39.5

73

8.5

Tabellerna 2-6 redovisar interbedömarreliabiliteten på olika nivåer. Samtliga värden för interbedömarreliabiliteten är beräknade utifrån korrelationen mellan de två bedömarnas värden och har sedan förlängts med Spearman-Browns formel för att ge reliabiliteten i de två bedömarnas sammanslagna värden. Till följd av att korrelationen beräknas på variationen mellan bedömarna, antas värdet 0 om ingen av bedömarna givit någon poäng inom en viss kategori (eftersom ingen variation i sådana fall existerar). I dessa fall har värdet uteslutits från beräkningarna då det är helt missvisande, och markeras i tabellerna med ett streck.

Tabell 2 illustrerar interbedömarreliabiliteten på den första nivån, dvs den totala slutsumman per motivationsbehov för hela testet som varje bedömare tilldelat de enskilda testdeltagarna. Interbedömarreliabiliteten är mycket hög för de samtliga tre motiven; 0.91 för prestationsmotivet, 0.97 för relationsmotivet och 0.94 för maktmotivet.

Tabell 2
Interbedömarreliabilitet för Nivå 1, dvs överensstämmelse
mellan bedömare vad gäller totalpoäng för de olika motivationsbehoven.

Prestation

Relation

Makt

0.91

0.97

0.94

I Tabell 3 redovisas interbedömarreliabiliteten för nivå 2, dvs hur hög överensstämmelse som råder mellan bedömare vad gäller förekomst/ej förekomst av respektive motivationsbehov per bild. Även här ligger interbedömarreliabiliteten högt, om än något lägre än för slutsummorna i ovanstående tabell. För prestationsmotivet varierar den mellan 0.68 (Bild 8) och 1.0 (för bilderna 5, 6 och 7), med ett medelvärde på 0.87. För relationsmotivet varierar interbedömarreliabiliteten mellan 0.80 (Bild 1) och 1.0 (Bild 9) med ett medelvärde på 0.91. Slutligen varierar interbedömarreliabiliteten för makt mellan 0.68 (Bild 6) och 1.0 (Bild 3 och 12), med medelvärdet 0.90.

Tabell 3
Interbedömarreliabilitet Nivå 2, dvs överensstämmelse mellan bedömare
vad gäller förekomst / ej förekomst av respektive motivationsbehov per bild.

Bild

Prestation

Relation

Makt

1

0.81

0.80

0.96

2

0.86

0.93

0.92

3

0.94

0.85

1.0

4

0.69

0.86

0.94

5

1.0

0.91

0.81

6

1.0

0.94

0.68

7

1.0

0.94

0.88

8

0.68

0.94

0.81

9

0.88

1.0

0.96

10

0.86

0.91

0.92

11

--

0.92

0.91

12

0.87

0.95

1.0

Medel:

0.87

0.91

0.90

I Tabell 4 visas interbedömarreliabiliteten för den givna totalpoängen per bild, vilket motsvarar den tredje granskningsnivån. Liksom på de ovanstående nivåerna återfinns en hög interbedömarreliabilitet. För prestationsmotivet befinner sig interbedömarreliabiliteten mellan 0.56 (Bild 8) och 1.0 (bilderna 6 och 7), med ett genomsnitt på 0.84. Motsvarande för relationsmotivet är 0.88 (Bild 3) och 0.99 (bilderna 8 och 10), med ett genomsnitt på 0.96. Interbedömarreliabiliteten för maktmotivet varierade mellan 0.88 (Bild 1) och 1.0 (Bild 12), med medelvärdet 0.93.

Tabell 4
Interbedömarreliabilitet för Nivå 3, dvs överensstämmelse mellan bedömare
vad gäller graden av motivationsbehov för respektive bild.

Bild

Prestation

Relation

Makt

1

0.77

0.89

0.88

2

0.76

0.97

0.92

3

0.94

0.88

0.95

4

0.82

0.97

0.96

5

0.97

0.98

0.96

6

1.0

0.97

0.76

7

1.0

0.96

0.92

8

0.56

0.99

0.93

9

0.91

0.97

0.97

10

0.62

0.99

0.96

11

--

0.97

0.89

12

0.87

0.95

1.0

Medel:

0.84

0.96

0.93

Beträffande interbedömarreliabilitetens fjärde nivå, dvs hur hög överensstämmelsen är mellan bedömare vad gäller förekomst/ej förekomst av olika underkategorier inom respektive motivationsbehov per bild, finns två möjliga sätt att beräkna värdena. Antingen beräknar man, som tidigare, på samtliga bilder, oavsett hur många procent av testdeltagarna som fantiserat kring de olika motiven. Man kan även utesluta de bilder som aktiverat färre än 30 % av deltagarna, och endast använda sig av de högaktiverande bilderna. Detta för att få fram mer relevanta siffror på vilka underkategorier som har sämre interbedömarreliabilitet.

Om man ser till resultatet då samtliga bilder är medräknade framgår att det finns en hög nivå på interbedömarreliabiliteten för de enskilda underkategorierna hos alla tre motiv. Värdena sträcker sig från 0.79 (instrumentell aktivitet på prestationsmotivet) till 1.0 (Ga- på prestationsmotivet). Medelvärden för de olika underkategorierna varierar mellan 0.80 (instrumentell aktivitet) och 0.94 (G+). Jämför man medelvärden för de tre olika motiven finner man att maktvärdet ligger lägst med 0.85 medan relationsvärdet är högst med 0.90.

Tabell 5
Översikt av medelvärden för interbedömarreliabiliteten på Nivå 4, dvs överensstämmelse mellan
bedömare vad gäller förekomst / ej förekomst av olika underkategorier, alla bilder inkluderade.

Motiv

N

I

Ga +

Ga -

Bp

Bw

G +

G -

Th

Medel:

Prestation

0.91

0.79

0.83

1.0

0.82

0.80

0.91

0.88

0.89

0.87

Relation

0.85

0.81

0.87

0.94

0.86

0.91

0.99

0.95

0.91

0.90

Makt

0.82

0.81

0.85

0.85

0.91

0.83

0.92

0.84

0.86

0.85

Medel:

0.86

0.80

0.85

0.93

0.86

0.85

0.94

0.89

0.89

 

Granskar vi istället interbedömarreliabiliteten genom att enbart titta på de högaktiverande bilderna ser resultatet inte fullt så bra ut. Vad skillnaden beror på berör jag i diskussionen. Trots att värdena för interbedömarreliabiliteten befinner sig lägre jämfört med ovanstående tabell ligger de flesta emellertid inom acceptabla gränser. Fyra värden befinner sig under 0.7: instrumentell aktivitet (0.69), Ga+ (0.68), Bp (0.66) och Bw (0.63), samtliga inom prestationsmotivet. Alla underkategorier har medelvärden som ligger över 0.7-gränsen, från 0.72 (instrumentell aktivitet) till 0.94 (G+). Medelvärden för varje motiv för sig när man tittar på underkategorierna var 0.78 för prestation, 0.82 för makt och slutligen 0.86 för relation.

Tabell 6
Översikt av medelvärden för interbedömarreliabiliteten på Nivå 4, dvs överensstämmelse
mellan bedömare vad gäller förekomst / ej förekomst av olika underkategorier, endast bilder
där Imagery kodats av någon bedömare på minst 15 deltagare.

Motiv

N

I

Ga +

Ga -

Bp

Bw

G +

G -

Th

Medel:

Prestation

0.83

0.69

0.68

1.0

0.66

0.63

0.92

0.85

0.74

0.78

Relation

0.79

0.76

0.81

0.97

0.77

0.85

0.98

0.93

0.87

0.86

Makt

0.77

0.70

0.78

0.76

0.92

0.79

0.93

0.83

0.87

0.82

Medel:

0.80

0.72

0.76

0.91

0.78

0.76

0.94

0.87

0.83

 

Slutligen presenteras i Tabell 7 en summering av alla genomsnittsvärden för de tre motiven. Visserligen har dessa siffror redan presenterats i de ovanstående tabellerna, men genom att sammanställa alla värden blir det lättare att få en överblick av eventuella tendenser. Och som tabellen visar går det att skönja en trend i resultatet, nämligen att relationsmotivet har högst medelvärde för interbedömarreliabiliteten vad gäller samtliga nivåer medan prestationsmotivet har lägst medelvärden på alla nivåer utom en, där följaktligen maktmotivet låg lite under (medelvärde för underkategorierna när man räknade på alla bilder). Medelvärdena sträcker sig från 0.78 till 0.97, vilket betyder att samtliga befinner sig över 0.7-gränsen.

Tabell 7
Översikt över samtliga medelvärden för motiven Prestation, Relation och Makt.

Prestation

Relation

Makt

Medelvärden för Nivå 1

0.91

0.97

0.94

Medelvärden för Nivå 2

0.87

0.91

0.90

Medelvärden för Nivå 3

0.84

0.96

0.93

Medelvärden för Nivå 4, alla bilder

0.87

0.90

0.85

Medelvärden för Nivå 4, endast högaktiverande bilder

0.78

0.86

0.82

 

Diskussion

Genomgång av interbedömarreliabiliteten för respektive nivå.

Som resultatet visat föreligger en hög eller mycket hög interbedömarreliabilitet vad gäller samtliga nivåer. Låt oss titta på de olika nivåerna och se hur de skiljer sig åt.

Nivå 1. Hur hög är överensstämmelsen mellan bedömare vad gäller totalpoäng för de olika motivationsbehoven?

Här återfinns den högsta korrelationen bedömarna emellan. Detta innebär att bedömarna kommit fram till ungefär samma poäng för varje försöksperson och motiv, vilket ju är en förutsättning för att testresultatet skall vara reliabelt. Som tidigare nämnts anses gränsen för acceptabla korrelationsvärden vara 0.7. På denna nivå var det lägsta värdet 0.91 (prestation), medan det högsta var 0.97 (relation).

Nivå 2. Hur hög är överensstämmelsen mellan bedömare vad gäller förekomst / ej förekomst av respektive motivationsbehov per bild?

Även här finns en relativt hög korrelation mellan de båda bedömarnas kodningar. Tre värden är betydligt lägre än de andra, nämligen korrelationsvärdena för prestationsmotivet på bild 4 (0.69) och bild 8 (0.68), samt för maktmotivet bild 6 (0.68). Dessa befann sig visserligen under 0.7, men eftersom underskridandet var relativt litet är det inte att betrakta som något problem. Alla övriga värden ligger över 0.8, vilket är ett bra resultat.

Nivå 3. Hur hög är överensstämmelsen mellan bedömare vad gäller graden av motivationsbehov för respektive bild?

På denna nivå, liksom den ovanstående, ligger de allra flesta korrelationsvärden över 0.7. Här finns två värden som är låga, korrelationen för bilderna 8 (0.56) och 10 (0.62), båda inom prestationsmotivet. I övrigt är värdena mycket höga, vilket visas av genomsnitten som ligger mellan 0.84 (prestationsmotivet) och 0.96 (relationsmotivet). Detta indikerar att även denna nivå inte har några problem med interbedömarreliabiliteten.

Nivå 4. Hur hög är överensstämmelsen mellan bedömare vad gäller förekomst / ej förekomst av olika underkategorier inom respektive motivationsbehov per bild?

Vad gäller denna nivå analyserades korrelationen på två sätt, dels för samtliga historier och dels enbart för de historier som utlöst någon reaktion hos åtminstone 15 av testdeltagarna. Det sista förfarandet för att eventuella variationer mellan bedömarnas kodningar när väl poäng utdelats skulle bli mer tydliga. Detta visade sig också vara fallet. Om interbedömarreliabiliteten beräknas för samtliga bilder är det lägsta värdet 0.79 (instrumentell aktivitet för prestationsmotivet), medan alla andra värden befinner sig över 0.8. Detta är ett tillfredsställande resultat, men man måste ha i åtanke att alla de historier som ingen av bedömarna kodat för ett visst motiv drar upp värdena för interbedömarkorrelationen för underkategorierna. Därför är det mer intressant att titta på enbart högaktiverande bilder, eftersom det där är lägre proportion "nollor" som drar upp värdena. Som tabell 6 visade, blir korrelationen sämre med detta förfarande. Särskilt tydligt blir detta vad gäller prestationsmotivet, där 4 underkategorier av 9 befinner sig under 0.7 (I:0.69; Ga+:0.68; Bp:0.66 och Bw:0.63). Emellertid är underskridandet även här relativt blygsamt. De två övriga motiven har dock inget observerat värde under 0.7, vilket innebär att för dessa motiv verkar även denna lägsta nivå vara tillfredsställande.

Jämförelse mellan de tre motivationsbehoven Prestation, Relation och Makt.

Som redan antytts under diskussionen kring nivå 4 har kodningen av prestationsbehovet en lägre reliabilitet jämfört med relations- och maktbehovet. Åtta av nio observerade värden under 0.7 återfinns under prestationsmotivet, ett under maktmotivet, medan samtliga värden hos relationsmotivet befinner sig över 0.7. Om man vidare tittar på Tabell 7 ovan, som är en sammanställning över medelvärden för samtliga nivåer, finner man att bedömningen av prestationsmotivet varit systematiskt sämre över alla korrelationsnivåer. Det är endast vid granskningen av underkategorierna (Nivå 4), alla bilder medräknade, som kodningen av prestationsbehovet inte hade lägst korrelationsvärden. Men då analysen av de högaktiverande bilderna kan sägas ge en tydligare bild av interbedömarreliabiliteten, är slutsatsen sålunda att prestationsbehovet i denna studie varit svårare att koda i jämförelse med de andra två motivationsbehoven. En intressant jämförelse kan göras mellan denna undersöknings resultat och Börjessons undersökning (1996), där Börjesson uppvisat en omvänd ordning vad gäller interbedömarreliabiliteten och fått högst överensstämmelse vid kodning av prestationsmotivet medan relationsmotivet uppvisat mycket låg överensstämmelse mellan bedömarna. Denna skillnad kan bero på att olika kodningsmaualer tillämpats vid de olika studierna, och att dessa tycks skilja sig åt i väsentliga avseenden som underlättar respektive försvårar kodningen av vissa motivationskategorier (Atkinson 1958 resp. McClelland & Steele 1972).

Slutsatser och avslutande ord.

Vilka slutsatser kan då dragas utifrån denna studie? Över lag har undersökningen visat upp en hög interbedömarreliabilitet för de undersökta motivationsbehoven i TAT. Bristerna som finns kan lokaliseras till kodningen av underkategorierna hos prestationsbehovet. Ett av problemen är för kodarna att avgöra om de eventuella hinder som återfinns i en historia är interna eller externa (Bp eller Bw). Även Instrumentell aktivitet (I) och Positivt förväntat måltillstånd (Ga+) har visats vara lite problematiskt att koda. Emellertid vore det oriktigt att säga att det är just dessa underkategorier som är svårkodade eftersom det inte finns några liknande problem beträffande behovsmotiven Relation och Makt. Jag kan därför inte rekommendera några specifika åtgärder vad gäller de berörda underkategorierna.

Beträffande kodningen av de tre olika motivationsbehoven och varför prestationsbehovet har en lägre interbedömarreliabilitet, kan jag inte hävda att manualen är diffus vad gäller just prestationsbehovet. Interbedömarreliabiliteten är över lag så pass hög även hos detta motiv, om manualen vore bristfällig borde rimligtvis interbedömarreliabiliteten vara betydligt lägre. Att hänvisa till att den tillämpade manualen var skriven på engelska medan de kodade historierna var skrivna på svenska vore även det fruktlöst, eftersom detta inte skulle gett sämre utslag hos endast ett av motiven. Däremot kanske anledningen står att finna hos bedömarna. Om någon av bedömarna haft problem att koda prestationsbehovet, kanske särskilt de fyra underkategorierna ovan, är det tillräckligt för att interbedömarreliabiliteten sjunker.

För att kartlägga dessa problem skulle det vara intressant att låta ytterligare bedömare koda materialet. Då skulle man dels kunna skönja om interbedömarreliabiliteten vad gäller prestationsbehovet fortfarande befinner sig lägre jämfört med de andra motiven, dels huruvida samma underkategorier får lägre reliabilitetsvärden. Dessutom vore det intressant att se om interbedömarreliabiliteten behåller sin höga nivå över lag, eller om den dras ner av att ytterligare bedömare tillkommer. Dock visar undersökningen att ett gediget förarbete, där bedömarna verkligen sätter sig in i kodningsmanualen med hjälp av lärare, bäddar för en hög interbedömarreliabilitet. Bedömare måste vara väl utbildade i testkodningen för att ett tillfredsställande resultat skall kunna uppnås. Troligtvis var bedömarna i den svenska studien (Börjesson, 1996) inte tillräckligt insatta i själva kodningsförfarandet, varför så låga reliabilitetsvärden erhölls. Vid Börjessons studie användes, som tidigare nämnts, dessutom en annan manual (McClelland & Steele 1972) vilket skulle kunna förklara den lägre interbedömarreliabiliteten. Uppenbarligen har Atkinsons manual, som tillämpats vid denna studie, varit mer framgångsrik för att säkra en god interbedömarreliabilitet.

Utifrån denna undersökning är slutsatsen att interbedömarreliabiliteten inte är något hinder för denna typ av mätning. På samtliga nivåer återfinns medelvärden som är fullt acceptabla. De brister som finns har troligtvis en intern förklaring, dvs problemet kan antagligen lokaliseras till några oklarheter hos någon av bedömarna. Angående andra aspekter beträffande denna TAT-studie hänvisas till Braun (1998).

Referenser

Atkinson, J. W. (Ed.). (1958). Motives in fantasy, action and society. Princeton, NJ: Van Nostrand.

Atkinson, J. W. (1981). Studying personality in context of an advanced motivational psychology. American Psychologist, 36, 117-128.

Atkinson, J. W., Bongort, K. & Price, L. H. (1977). Explorations using computer simulation to comprehend thematic apperceptive measurement of motivation. Motivation and Emotion, 1, 1-27.

Atkinson, J. W. & Birch, D. (1978). An introduction to motivation. New York: Van Nostrand Reinhold.

Braun, C. (1998). Thematic Apperception Test – en empirisk prövning av bildmaterialet. (C-uppsats i psykologi). Uppsala universitet, Institutionen för psykologi.

Börjesson, A. (1996). Motivationsbehov – en jämförelse mellan grupper. (C-uppsats i psykologi). Uppsala universitet, Institutionen för psykologi.

Deci, E. L., & Ryan, R. M. (1985). Intrinsic motivation and self determination in human behavior. New York: Plenum.

Entwistle, D. (1972). To dispel fantasies about fantasy-based measures of achievement motivation. Psychological Bulletin, 77, 377-391.

Geen, R. G. (1995). Human motivation: A social psychological approach. Pacific Grove, CA: California Brooks / Cole cop.

Jacobs, R. L. & McClelland, D. C. (1994). Moving up the corporate ladder: A longitudinal study of the leadership motive pattern and managerial success in women and men. Consulting Psychology Journal, 46, 32-41.

Madsen, K. B. (1974). Motivation – Drivkrafterna bakom våra handlingar. Lund: Wahlström & Widstrand.

Marongiu, S. & Rigas, G. (1996). Dataprogram för TAT-testning. Uppsala universitet, Institutionen för psykologi.

McClelland, D. C., Atkinson, J. W., Clark, R., & Lowell, E. (1953). The achievement motive. New York: Appelton – Century – Crofts.

McClelland, D. C. & Steele, R. (1972). A work-shop book in motivation. New York: General Learning Process.

McClelland, D. C. (1985). How motives, skills and values determine what people do. American Psychologist, 40, 812-825.

McClelland, D. C. & Koestner, R. (1989). Perspectives on competence motivation. In L. Pervin (Ed.), Handbook of personality theory and research. New York: Guilford Press.

McClelland, D. C., Koestner, R. & Weinberger, J. (1989). How do self-attributed and implicit motives differ?. Psychological Review, 96, 690-702.

Murray, H. A. (1938). Explorations of personality. New York: Oxford University Press.

Piotrowski, C. & Keller, J. W. (1984). Psychodiagnostic testing in APA-approved clinical psychology programs. Professional Psychology: Research and Practice, 3, 450-456.

Raven, Molloy & Corcoran (1972). Toward a questionnaire measure of need achievement. Human Relations, 25, 469-492.

Sheppard, H. L. & Belitsky, A. H. (1966). The job hunt. Baltimore: John Hopkins University Press.

Sorrentino, R. M. & Higgins, E. T. (1986). Motivation and cognition: Warming up to synergism. In R. M. Sorrentino & E. T. Higgins (Ed.), Handbook of motivation and cognition (pp. 3-20). New York: Guilford Press.

Winter, D. (1991). A motivational model of leadership predicting long-term management success from TAT measures of power motivation and responsibility. Leadership Quarterly, 2, 67-80.

Yukl, G. (1994). Leadership in organizations. New Jersey: Prentice-Hall.

Bilagor

Bilaga 1. Översikt av bildmaterialet.

Bilder som presenterats för samtliga testtagare.

Bild 1. "Pojke med fiol" (Murrays bild 1).

Bild 2. "Par på restaurang" (McClelland).

Bild 3. "Pojke och operation" (Murrays bild 8BM).

Bild 4. "Laboratorium" (McClelland).

Bild 5. "Cirkusartister" (McClelland).

Bild 6. "Kvinna som kikar in genom en dörr. (Murrays bild 5).

Bild 7. "Par på bänk vid en bro" (McClelland).

Bild 8. "Kaptenen" (McClelland).

Bild 9. "En äldre och en yngre man" (Murrays bild 7BM).

Bild 10. "Mor och son" (Murrays bild 6BM).

Bild 11. "Ledsen kvinna" (Murrays bild 3GF).

Bild 12. "Man på kontoret" (McClelland).

Konstbilder som presenterats för hälften av alla testtagare.

Bild 1. "Familjebild vid pianot" (Matisse).

Bild 2. "Mannen i soffan" (Hockney).

Bild 3. "Par som betraktar en allé" (Hockney).

Bild 4. "Självporträtt av Hockney" (Hockney).