Hvordan måles kreativitet?
Forskningen i kreativitet har været hæmmet af manglen på gode mål for kreativitet. Kapitel 5 indeholder en diskussion vedrørende forskning om domænespecifikke midler til testning af kreativitet. Det, jeg nu skal forklare, er (sådan set) det modsatte: hvad kreativitetstestning betyder for forskning om domænespecificitet.
Det er desværre sådan, at de måder, hvorpå kreativitet oftest er blevet testet, og de antagelser, der ligger til grund for mange kreativitetstest, gør disse test uegnede til at blive brugt til at afgøre, om kreativitet er domænespecifik eller domænegeneralistisk. Selv hvis de mest udbredte test var gyldige, hvilket de for det meste ikke er, ville de stadig ikke være nyttige til at bedømme spørgsmål om domænegeneralitet og domænespecificitet, fordi de simpelthen er de forkerte slags test. Situationen svarer lidt til at være tvunget til at bruge en staveprøve til at afgøre, om musikalske, matematiske, kunstneriske, atletiske og verbale evner er relateret til hinanden. Disse fem typer af evner kan være relateret eller ej, og der findes forskningsdesigns, der kan hjælpe med at undersøge, hvilke relationer der eventuelt kan være til disse evner. Men selv en velunderbygget, gyldig test af stavning ville i sig selv være af ringe nytte til at besvare spørgsmål om mulige forbindelser mellem disse forskellige typer af evner.
Situationen er vanskelig, men den er ikke håbløs. Ligesom man kan bruge scoringer på separate test af musikalske, matematiske, kunstneriske, sportslige og verbale evner til at undersøge, hvilke indbyrdes sammenhænge der kan være mellem disse evner, er der måder at vurdere kreativitet på forskellige områder, som kan bruges til at besvare spørgsmål om domænegeneralitet/specificitet. Men den slags test, der er behov for, er ikke de billige, let administrerbare og objektivt scorbare domænegenerelle test, som længe har domineret vurderingen af kreativitet.
Test af divergent tænkning var i mange år den mest almindeligt anvendte måling af kreativitet. I en gennemgang i 1984 af al offentliggjort kreativitetsforskning stod Torrance-testene, som ikke er de eneste anvendte test af divergent tænkning, men bestemt de mest anvendte, for tre fjerdedele af al kreativitetsforskning med studerende og 40 % af den mindre delmængde af al kreativitetsforskning med voksne som forsøgspersoner (Torrance & Presbury, 1984). Torrance-testene og andre divergent-tænkningstests er baseret på Guilfords (1956) Structure of the Intellect-model, hvori han hævdede, at “divergent produktion” – at tænke på en bred vifte af idéer som svar på et åbent spørgsmål eller en opfordring – var en væsentlig bidragyder til kreativitet. I sin definition af divergent produktion (som betyder det samme som divergent tænkning, et begreb, som Guilford også brugte; divergent tænkning er det begreb, der er mere almindeligt anvendt i dag) skelner Guilford klart mellem divergent og konvergent tænkning:
I prøver med konvergent tænkning skal eksaminanden nå frem til ét rigtigt svar. De givne oplysninger er som regel tilstrækkeligt struktureret til, at der kun er ét rigtigt svar. . . n eksempel med verbalt materiale ville være: “Hvad er det modsatte af hårdt?” Ved divergent tænkning skal den tænkende person søge meget rundt, og ofte er der flere svar nok eller ønskes flere svar. Hvis man beder eksaminanden om at nævne alle de ting, han kan komme i tanke om, som er hårde, også spiselige, også hvide, har han en hel klasse af ting, der kan gøre det. Det er i kategorien divergent tænkning, at vi finder de evner, der har størst betydning for kreativ tænkning og opfindsomhed. (Guilford, 1968, s. 8)
Torrance, hvis navnkundige Torrance Tests of Creative Thinking faktisk er tests af divergent tænkning (disse tests vil blive diskuteret nærmere senere), fremsatte en lignende pointe:
Learning by authority synes primært at involvere sådanne evner som genkendelse, hukommelse og logisk ræsonnement – hvilket i øvrigt er de evner, der oftest vurderes ved traditionelle intelligenstests og målinger af skolastisk egnethed. I modsætning hertil kræver kreativ læring gennem kreative og problemløsende aktiviteter, ud over genkendelse, hukommelse og logisk ræsonnement, . . evaluering . . . . ., divergerende produktion . . . . og omdefinering. (Torrance, 1970, s. 2)
Fire aspekter af divergent tænkning nævnes ofte i litteraturen:
–
Flydighed er det samlede antal svar på en given stimuli, “det samlede antal idéer, der gives på en hvilken som helst divergent tænkeøvelse”. (Runco, 1999a, s. 577)
–
Originalitet er særprægetheden af svarene på en given stimuli, “det usædvanlige … i en eksaminandens eller respondentens idéer”. (Runco, 1999a, s. 577)
–
Fleksibilitet er antallet af forskellige kategorier eller typer af reaktioner på en given stimuli, eller mere bredt, “en ændring i betydningen, brugen eller fortolkningen af noget”. (Guilford, 1968, s. 99)
–
Elaboration er udvidelsen eller udvidelsen af ideer i ens reaktioner på en given stimuli, “detaljerigdommen i de ideer, man producerer”. (Baer, 1997a, s. 22)
En nyere bog om vurdering af kreativitet illustrerede disse med følgende scenarie:
Hvis en person planlagde en social lejlighed på en restaurant for at fejre en særlig begivenhed, ville hun måske ønske at udarbejde en liste over mulige steder. Hun kan udarbejde en liste med 50 potentielle restauranter (høj flydende sprogfærdighed), en liste, der omfatter restauranter, som hendes venner sandsynligvis ikke ville komme i tanke om (høj originalitet), en liste med en bred vifte af typer af restauranter (høj fleksibilitet) eller en liste, der kun omfatter indiske restauranter, men som opregner alle mulige sådanne etablissementer i området (høj uddybning). (Kaufman, Plucker, & Baer, 2008a, s. 18)
De fleste tidlige test af kreativitet var i det væsentlige divergent-tænkningstests, som i mange år havde meget lidt konkurrence bortset fra hinanden. Deres anciennitet er sandsynligvis en af grundene til, at testene er blevet anvendt i så stor udstrækning, men de havde også andre fordele. De udgjorde en bekvem parallel til IQ-tests med et enkelt tal (selv om deres fortalere, herunder Torrance selv, ofte argumenterede imod en sådan konceptualisering; Kim, Cramond, & Bandalos, 2006); testene er enkle at administrere, selv til små børn; og ideen om divergent tænkning, som de er baseret på, er let at forstå og har en stærk intuitiv appel (Baer, 1993; Kaufman et al, 2008a; Kim, 2008; Runco, 1999a; Torrance, 1993; Torrance & Presbury, 1984; Wallach & Wing, 1969).
Divergent tænkning, der er konceptualiseret som en komponent af kreativ tænkning, er fortsat et vigtigt begreb blandt kreativitetsforskere og er grundlaget for nogle af de mest almindelige kreativitetstræningsaktiviteter (såsom brainstorming, selv om brainstorming gik et par år forud for Guilfords opdagelse af divergent produktion; Guilford, 1956; Osborn, 1953). Divergent tænkning kan opfattes som enten domænegenerel eller domænespecifik, men opfattelsen af den som en domænegenerel færdighed er langt mere almindelig. I det omfang kreativitet er domænespecifik, kan domænegenerelle teorier om divergent tænkning imidlertid ikke være gyldige og må erstattes af domænespecifikke versioner.
Domænespecifik divergent tænkning fungerer nøjagtig på samme måde som domænegenerel divergent tænkning ved at producere en række mulige svar på en åben opfordring (og flydende, fleksibilitet, originalitet og uddybning er fortsat nøglekomponenter i divergent tænkning under domænespecificitet). Forskellen er blot, at de divergerende tænkefærdigheder, der fremmer kreativitet inden for ét domæne, adskiller sig fra de divergerende tænkefærdigheder, der fører til kreativitet inden for andre domæner (f.eks, at være i stand til at tænke på mange forskellige og usædvanlige måder at forklare division med brøker kan føre til kreativitet i matematikundervisning, men har ringe værdi på andre områder, f.eks. billedhuggeri, komponering af musik eller historieundervisning).
Da divergent tænkning kan konceptualiseres som en bred vifte af domænespecifikke færdigheder snarere end en enkelt, domænegenerel færdighed, kræver accept af domænespecificitet ikke, at kreativitetsforskere opgiver divergent tænkning som en vigtig bidragyder til kreativitet. Domænespecificitet hævder, at brugen af domænegenerelle test af divergerende tænkning ikke kan være gyldig, men at man stadig kan udtænke og bruge domænespecifikke test, hvis man har brug for dem til et særligt formål, som det kan være tilfældet i kreativitetsforskningen. Domænespecificitet ændrer også de måder, man skal gå til at undervise folk i at være mere kreative, men selv når man underviser sådanne kreative tænkefærdigheder direkte, som det vil blive vist i kapitel 6 om kreativitetstræning, kan divergent tænkning være lige så vigtig under en domænespecifik fortolkning; den skal blot anvendes på en lidt anden måde, hvilket vil påvirke de typer af opfordringer og træningsaktiviteter, man kan vælge. Det er sandsynligvis rigtigt, at en eller anden form for divergent tænkning (enten i dens generiske domænegenerelle version eller dens nyere domænespecifikke konceptualisering) sandsynligvis er en del af kreativ tænkning – det er et empirisk spørgsmål, hvis svar er blevet noget sløret af brugen af angiveligt (men i virkeligheden ikke) domænegenerel træning og testning af divergent tænkning – selv om det ikke længere synes sandsynligt, at det er den eneste eller primære ingrediens, som det nogle gange er blevet antaget tidligere (Amabile, 1996; Kaufman, 2009; Kaufman & Baer, 2005a, 2006; Simonton, 2010a; Sternberg, 1999).
Det er desværre den domænegenerelle version af divergent tænkning, der tjener som grundlag for nogle af de mest udbredte kreativitetstests. Domænespecificitet sætter spørgsmålstegn ved brugen af sådanne test og udfordrer gyldigheden af de forskningsresultater, der er baseret på disse test. Når der skal vælges foranstaltninger til brug i forbindelse med forskning om domænegeneralitet/specificitet, udgør divergerende tænkningstests et særligt problem, fordi domænegeneralitet er en indbygget antagelse i testene. Der findes f.eks. to forskellige versioner af Torrance-testene, en figural og en verbal, men begge anvendes rutinemæssigt som domænegenerelle test.
Hver af de to Torrance-test rapporterer forskellige delresultater. Der er sket mange ændringer i disse delresultater i årenes løb, men som et eksempel hævder den figurale test i øjeblikket at “vurdere fem mentale egenskaber” og 13 “kreative styrker” (Scholastic Testing Service, 2013). Der er også et samlet “kreativitetsindeks”, men Torrance advarede selv mod enhver fortolkning af hans test med enkelttal:
Torrance har frarådet brugen af sammensatte scorer for TTCT. Han advarede om, at brugen af en enkelt score som en sammensat score kan være misvisende, fordi hver subskala score har en uafhængig betydning. (Kim et al., 2006, s. 461)
Torrance fandt også, at hans to domænespecifikke test af divergent tænkning stort set ikke var korreleret:
Svarene på de verbale og figurale former af TTCT er ikke kun udtrykt i to forskellige modaliteter . . . men de er også mål for forskellige kognitive evner. Faktisk fandt Torrance (1990) en meget lille korrelation (r = .06) mellem præstationerne på de verbale og figurale test. (Cramond et al., 2005, pp. 283-284)
Torrances advarsler er imidlertid faldet for døve ører. Underskala-scoringer, der måler forskellige aspekter af divergent tænkning, ignoreres rutinemæssigt til fordel for de samlede kreativitetsindeks-scoringer, især af programmer for begavede/begavede, som er de mest aktive brugere af Torrance-testene (Scholastic Testing Service, 2013), og forskere hævder nu ofte, at det samlede kreativitetsindeks er den bedste forudsigelse af kreative evner (f.eks, Plucker, 1999; Yamada & Tam, 1996).
Det faktum, at Torrance skabte to forskellige domænespecifikke test af divergent tænkning og fandt, at de i det væsentlige var ortogonale og derfor målte to meget forskellige evner (Cramond et al., 2005), har naturligvis skabt problemer for dem, der har brugt begge test i samme undersøgelse og fortolket dem begge som mål for domænegenerel kreativitet. For eksempel fandt man i en nylig undersøgelse, der blev gennemført med det formål at validere Torrance-testene, at en af testene korrelerede med centrale resultatmålinger, men at den anden ikke gjorde det. I det tilfælde forudsagde scorer for verbal divergent tænkning mange af de ting, som undersøgelsen havde brugt som bevis for kreativ præstation (ting, som forsøgspersonerne selv havde rapporteret som personlige bedrifter fra en tjekliste over kreative bedrifter), men det gjorde scorer for figural divergent tænkning ikke. Som forfatteren forklarede:
Den betydning af verbal DT i forhold til figural DT kan skyldes en sproglig bias i de voksne kreative præstationschecklister for voksne. For eksempel, hvis et flertal af de kreative præstationer krævede en høj grad af sprogligt talent i modsætning til rumligt talent eller problemløsningstalent, ville de verbale DT-tests forventes at have en betydeligt højere korrelation til disse typer præstationer end andre former for DT. (Plucker, 1999, s. 110)
Dette resultat er præcis, hvad domænespecificitetsteorien ville forudsige. Forskellige mål for kreativitet, der er forankret i forskellige domæner, vil kun forudsige kreativ præstation inden for deres respektive domæner. Desværre har denne slags resultater (herunder resultaterne fra testens skaber) ikke fået dem, der markedsfører Torrance-testene, til at skrue ned for deres påstande. Både den figurale og den verbale form af testen hævder at være generelle test af kreativitet (Scholastic Testing Service, 2013).
Da divergent-tænkningstests som Torrance-testene forudsætter domænegeneralitet, kan de næppe anvendes i undersøgelser, hvis formål er at teste, om kreativitet er domænegenerelt eller domænespecifikt (selv om resultater fra testene, på trods af deres påstande om domænegeneralitet, giver beviser, som f.eks. det, Torrance selv har tilbudt, at kreativitet er domænespecifikt; Cramond et al., 2005). Til den slags forskning er der behov for en vurderingsteknik, der er agnostisk med hensyn til domænegeneralitet/specificitet.
Derimod har divergent tænkning desværre ikke længere hverken den form for monopol, som den engang havde inden for kreativitetsteori og testning, eller den brede respekt, som den engang skabte blandt kreativitetsteoretikere og -forskere. Der er blevet udviklet andre kreativitetstests, og selv om ingen af dem har opnået den form for næsten universel accept, som Torrance-testene (og andre divergent-tænkningstests) engang havde, giver de andre muligheder som forskningsredskaber.
En nyere bog om kreativitetsvurdering (Kaufman et al., 2008a) indeholdt kapitler om fire slags kreativitetsmålinger: divergent tænkning, vurderinger fra andre (lærere, jævnaldrende, forældre), selvvurderinger og en procedure kaldet Consensual Assessment Technique (CAT), hvor eksperter vurderer kreativiteten i ting, som folk har skabt (digte, kunstværker, teorier, gåder, souffléer, reklamer, optrædener af enhver art; den kan bruges til stort set alt).
Evalueringer af andre og selvvurderinger kræver ikke en antagelse om hverken domænegeneralitet eller domænespecificitet, men den måde, hvorpå vurderingerne er struktureret, kan (og gør det ofte) tilføje en sådan antagelse. Hvis man spørger om X’s kreativitet som arkitekt, er der ikke nogen antagelse om hverken domænegeneralitet eller domænespecificitet. (Hvis kreativitet rent faktisk er domænegenerelt, vil X’s kreativitet inden for arkitektur naturligvis også være udtryk for X’s kreativitet i almindelighed. Men at spørge om X’s kreativitet inden for arkitektur tillader kun domænegeneralitet – det forudsætter det ikke – og det tillader ligeledes, at kreativitet kan være domænespecifik). Men hvis man blot spørger, hvor kreativ X er, så forudsætter spørgsmålet, at svaret vil gælde for X mere generelt. Et generelt “Hvor kreativ er X?”-spørgsmål forudsætter derfor domænegeneralitet og kan som sådan ikke hjælpe en forsker, der forsøger at afgøre, hvor domænegenerel eller domænespecifik kreativitet kan være. Desværre er spørgsmålene i de fleste tilfælde, hvor forskere har spurgt om andres kreativitet, blevet formuleret på en måde, der kræver domænegenerelle svar, og som sådan er de ikke særlig nyttige til at afgøre eventuelle tvister om domænegeneralitet/specificitet.
Selvvurderinger af kreativitet ligner andres vurderinger, idet de kan spørge om kreativitet generelt (og dermed forudsætter domænegeneralitet) eller om kreativitet inden for specifikke domæner (hvilket ikke forudsætter nogen formodninger om generalitet/specificitet). Undersøgelser af denne art har haft tendens til at vise en stor domænespecificitet (som diskuteret i kapitel 2), men denne teknik har to store svagheder:
Selvvurderinger i almindelighed og selvvurderinger af kreativitet i særdeleshed har tendens til at have begrænset validitet. (Nogle vil måske endda gå endnu længere og hævde, at de ikke har nogen validitet overhovedet, men uanset hvad – med enten meget begrænset validitet eller ingen validitet overhovedet – er de betydeligt mindre end ideelle forskningsredskaber).
Men selv om folk, når de bliver bedt om at vurdere deres egen kreativitet på forskellige områder, har en tendens til at vurdere sig selv forskelligt på forskellige områder, kunne man hævde, at selv om sådanne spørgsmål faktisk ikke forudsætter domænespecificitet, kan de have en tendens til at skubbe svarene i den retning. Hvis kreativitet trods alt var domænegenerelt, hvorfor skulle man så spørge om kreativitet på mange forskellige områder? Det kunne for respondenterne se ud til, at de, der stiller spørgsmålene, faktisk antager domænespecificitet.
Selvvurderinger og andres vurderinger har således ikke været særligt nyttige til at besvare spørgsmål om domænegeneralitet/specificitet. Divergent-tænkningstests forudsætter typisk domænegeneralitet; faktisk, selv om de ikke behøver at gøre det, gør alle almindeligt anvendte divergent-tænkningstests – selv dem som Torrance’s, der bærer de domænebaserede etiketter figural og verbal – denne antagelse og opfordrer til domænegenerel fortolkning. Divergent-thinking-tests står også over for det problem, at beviserne for validiteten af divergent-thinking-tests som mål for kreativitet i bedste fald er noget svage. Som allerede nævnt handlede den første debat, der nogensinde blev sponsoreret af American Psychological Association’s Division 10 (Psychology of Aesthetics, Creativity and the Arts), om gyldigheden af divergent-tænkningstests som Torrance-testene (Baer, 2009; Kim, 2009), hvilket tyder på, at det er et åbent spørgsmål. (Debattens titel var “Are the Torrance Tests of Creative Thinking Still Relevant in the 21st Century?”) Så selv hvis man kunne finde en måde at bruge divergent-tænkningstests til at måle kreativitetens domænegeneralitet/specificitet (f.eks. ved at give forsøgspersoner tests af divergent-tænkning i forskellige domæner og sammenligne resultaterne, noget Torrance selv gjorde, med resultater, der klart pegede på domænespecificitet; Cramond et al, 2005), ville spørgsmål om validiteten af divergent-tænkningstests (selv domænespecifikke divergent-tænkningstests) underminere tilliden til de opnåede resultater.
Det efterlader den anden primære metode til vurdering af kreativitet, CAT (Amabile, 1982, 1983, 199619821989831996). CAT vurderer kreativitet på alle niveauer (uanset om det drejer sig om den almindelige lille-c-kreativitet, som selv børn udviser, eller den paradigmeskiftende Big-C-kreativitet hos de mest originale og indflydelsesrige tænkere inden for deres områder) på samme måde, som kreativitet oftest vurderes i den virkelige verden – ved hjælp af udtalelser fra eksperter inden for det relevante område. Ligesom Nobelprisvinderne udvælges af paneler af eksperter inden for hvert område, som bedømmer kreativiteten i bidrag til deres respektive områder, anvender CAT eksperter inden for et område til at bedømme kreativiteten i de faktiske produkter inden for det pågældende område. Eksperternes vurderinger kan naturligvis ændre sig over tid; standarderne på et hvilket som helst område, hvad enten det er kunstnerisk, videnskabeligt eller praktisk, er ikke uforanderlige, og det, der i en periode blev betragtet som kreativt, kan i en anden periode blive betragtet som mindre kreativt (og omvendt), ligesom eksperternes kvalifikationer på et hvilket som helst område kan ændre sig. Men det bedst mulige skøn over et produkts kreativitet på et givet tidspunkt er den kollektive vurdering af de anerkendte eksperter på det pågældende område. Der findes simpelthen ikke nogen bedre måling (Baer & McKool, 2009, 201420092014).
De eksperter, der foretager kreativitetsvurderinger i en CAT-vurdering, foretager deres vurderinger uafhængigt – der er ingen mulighed for dem for at påvirke hinandens mening – hvilket giver mulighed for at kontrollere inter-rater reliabiliteten, som generelt er ret god. Der er naturligvis behov for forskellige eksperter afhængigt af de artefakter, der skal bedømmes. Digtere, poesikritikere og poesiundervisere kan fungere som dommere, hvis de pågældende artefakter er haiku-digte, mens kunstnere, kunstkritikere og kunstundervisere vil være passende, hvis artefakterne er collager. Hver ekspert bliver bedt om at vurdere kreativiteten af hvert enkelt produkt i undersøgelsen individuelt i forhold til alle de andre i prøven og ikke i forhold til en ekstern standard. Alle vurderinger er relative i forhold til kreativiteten hos de andre artefakter i den gruppe, der vurderes. Der anvendes en Likert-skala, så scoringerne spredes over en række mulige vurderinger, og dommerne opfordres til at bruge hele skalaen, idet de mest kreative artefakter i gruppen vurderes med den højeste score og de mindst kreative med den laveste score, med det formål at differentiere den sammenlignende kreativitet blandt artefakterne i gruppen. Gennemsnitsvurderingerne fra alle dommerne (som kan være 10-15 i en typisk undersøgelse) anvendes som kreativitetsscore for hvert af artefakterne (Amabile, 1996; Baer, Kaufman, & Gentile, 2004; Kaufman et al., 2008a).
Processen er både enkel og ligetil, selv om enkel desværre ikke betyder, at den er hverken nem eller billig. I modsætning til de universitetsstuderende, der udgør emnet for en stor del af den psykologiske forskning, er eksperter ikke så frit tilgængelige. Der er brug for forskellige slags eksperter, afhængigt af hvilke artefakter der skal bedømmes, og eksperterne bliver typisk betalt for deres arbejde. Nogle undersøgelser har vist, at kvasieksperter inden for visse områder (f.eks. studerende inden for et område, som måske endnu ikke kan betegnes som eksperter) giver vurderinger, der minder ret meget om eksperternes, hvilket kan reducere omkostningerne en smule. Brug af nybegynderbedømmere (f.eks. universitetsstuderende) giver dog sjældent samme slags bedømmelser som eksperter, så CAT kræver generelt bedømmere med i det mindste en beskeden ekspertise inden for det pågældende område og er derfor dyrere end mange andre metoder til vurdering af kreativitet (Kaufman, Baer, & Cole, 2009b; Kaufman, Baer, Cole, & Sexton, 2008b; Kaufman, Baer, Cropley, Reiter-Palmon, & Sinnett, 2013a).
CAT er noget ressourcekrævende, men den har mange fordele og er blevet kaldt “guldstandarden” inden for kreativitetsvurdering (Carson, 2006). Langtidsstabiliteten af enkelte CAT-vurderinger er lige så god som langtidsstabiliteten af scoringer på veletablerede divergent-tænkningstests med flere elementer (f.eks. falder test-retestkorrelationerne efter et år i begge tilfælde i 0,50-området med forsøgspersoner i folkeskolealderen), og hvis flere kreative produkter af samme type oprettes og bedømmes i både før- og eftertestning, viser CAT’s langtidsstabilitet endnu bedre resultater (Baer, 1994c; Kogan, 1983). CAT kan bruges til at bedømme kreativiteten af artefakter inden for næsten ethvert område, og i modsætning til divergent-tænkning og andre tests af delfærdigheder, der teoretiseres at være forbundet med kreativitet, vurderer CAT den faktiske kreative præstation og er derfor ikke afhængig af accept eller validitet af en bestemt teori om kreativitet. CAT-testen undgår også halo-effekter og andre personlige skævheder, der kan forstyrre andres eller ens egen vurdering af kreativitet. Selv om bedømmelserne drejer sig om kreativiteten i artefakter inden for et givet område, foretages der ingen antagelser ved brug af CAT om kreativitetens domænespecificitet eller generalitet. Den er ikke knyttet til nogen teori om kreativitetens natur og er fuldstændig neutral med hensyn til spørgsmål om domænespecificitet/generalitet, hvilket gør den til en ideel målestok for kreativitet på dette område.
Kapitel 2 vil gennemgå forskningen om kreativitetens domænespecificitet og generalitet i detaljer, hvoraf en stor del anvender CAT. Resultaterne har været ret konsekvente med hensyn til at vise ringe domænegeneralitet. En vigtig forskningsmetode har været at give forsøgspersoner en række forskellige opgaver inden for forskellige domæner (f.eks. lave en collage, skrive et digt, skrive en historie), lade paneler af eksperter inden for de respektive domæner uafhængigt vurdere disse produkter med hensyn til kreativitet ved hjælp af CAT og derefter se efter korrelationer mellem vurderingerne inden for forskellige domæner. De to konkurrerende teorier – domænegeneralitet og domænespecificitet – giver forskellige forudsigelser med hensyn til den faktiske kreative præstation. Sådan opsummerede en kreativitetsforsker kortfattet, hvordan disse forudsigelser ville være forskellige:
Domænegeneralitet ville blive understøttet af høje interkorrelationer mellem forskellige kreative adfærdsformer … mens domænespecificitet ville blive understøttet af relativt lave korrelationer mellem forskellige adfærdsformer. (Ivcevic, 2007, s. 272)
De korrelationer, der er rapporteret i de mange undersøgelser, der har foretaget præcis denne sammenligning, har haft en tendens til at svæve omkring nul (især hvis varians, der kan tilskrives intelligens, fjernes; kapitel 2 gennemgår denne forskning i detaljer, men se Baer, 2010, 201320102013 for resuméer), og selv forfattere, der har hævdet at have fundet en vis grad af domænegeneralitet, finder den typisk kun inden for domæner. For eksempel rapporterede Conti, Coon og Amabile (1996) korrelationer af kreativitetsvurderinger på flere opgaver til skrivning af noveller, der varierede fra 0,43 til 0,87, og nogle mindre, men stadig statistisk signifikante, korrelationer mellem flere forskellige kunstopgaver (kunstopgaverne lignede hinanden mindre end skriveopgaverne, så dette resultat var forventet). Disse resultater er imidlertid alle korrelationer inden for et domæne, og de viser derfor kun, at der inden for et domæne (f.eks. novelleskrivning eller kunst) er en vis generalitet, som både domænespecificitet og domænegeneralitet forudsiger. I modsætning til de mange statistisk signifikante korrelationer inden for et domæne var de 13 rapporterede korrelationer på tværs af domæner (skrivning-kunst) – de korrelationer, der har betydning for domænespecificitet – alle meget små, og uanset om de var positive eller negative, var ingen af dem statistisk signifikante. Så på trods af disse forfatteres påstande om beviser for domænegeneralitet var det eneste, de faktisk fandt, inden for domænet generelitet (dvs. domænespecificitet).
Feist (2004) kommenterede, at det er en “tiltalende og i sidste ende fast amerikansk forestilling, at en kreativ person kan være kreativ på ethvert domæne, han eller hun vælger. Det eneste, personen skulle gøre, ville være at beslutte, hvor hun eller han skulle anvende sine talenter og bestræbelser, øve sig eller træne meget, og voilà, så har man en kreativ præstation. Ifølge dette synspunkt overtrumfer talentet domænet, og det er virkelig noget vilkårligt, inden for hvilket domæne den kreative præstation kommer til udtryk.” Selv om det er tiltalende, konkluderede Feist, at “dette er en temmelig naiv og i sidste ende falsk holdning, og at kreativt talent faktisk er domænespecifikt … kreativitet og talent er normalt ikke blandt de generelle færdigheder inden for et domæne” (s. 57).2
Efter at have gennemgået beviserne for og imod domænespecificitet i kapitel 2, undersøger kapitlerne 3-63456, hvad disse forskningsresultater betyder for kreativitetsteori, kreativitetsforskning, kreativitetstest og kreativitetstræning, efterfulgt af et kig på, hvilke former for kreativitetsteorier der ville være levedygtige under domænespecificitet. Selv om læserne opfordres til at læse hvert af disse kapitler i rækkefølge, er de skrevet med den forståelse, at mange læsere vil have særlige interesser i blot et eller få af kapitlerne. At springe kapitler over bør ikke føre til stor forvirring (selv om det har været nødvendigt at skrive dem på en måde, der gør dette muligt, og som har krævet lejlighedsvis gentagelse af nogle centrale idéer og forskningsresultater). Læsere, der allerede er bekendt med (og overbevist af) de forskningsresultater, der støtter domænespecificitet, vil f.eks. måske ønske at springe den omfattende gennemgang af disse resultater i kapitel 2 over, som mere detaljeret dækker nogle af de resultater, der er beskrevet mere kortfattet i dette kapitel.