Hur mäts kreativitet?
Forskning om kreativitet har hindrats av bristen på bra mått på kreativitet. Kapitel 5 innehåller en diskussion om forskning om domänspecifika medel för testning av kreativitet. Det jag behöver förklara nu är (typ av) det motsatta: vad kreativitetstestning betyder för forskning om domänspecificitet.
Tyvärr gör de sätt på vilka kreativitet oftast har testats och de antaganden som görs i många kreativitetstester att dessa tester är olämpliga för att användas för att avgöra om kreativitet är domänspecifik eller domängenerell. Även om de mest använda testerna var giltiga, vilket de för det mesta inte är, skulle de ändå inte vara användbara för att bedöma frågor om domängeneralitet och domänspecificitet eftersom de helt enkelt är fel sorts tester. Situationen är ungefär som att tvingas använda ett stavningstest för att avgöra om musikaliska, matematiska, konstnärliga, atletiska och verbala förmågor är besläktade. Dessa fem typer av förmågor kan vara relaterade eller inte, och det finns forskningsmetoder som kan hjälpa till att undersöka vilka eventuella samband som finns. Men även ett väl underbyggt, giltigt stavningstest skulle i sig självt inte vara till någon större nytta när det gäller att besvara frågor om eventuella samband mellan dessa olika typer av förmågor.
Situationen är svår, men den är inte hopplös. Precis som man skulle kunna använda resultat på separata tester av musikaliska, matematiska, konstnärliga, idrottsliga och verbala förmågor för att undersöka vilka inbördes samband som kan finnas mellan dessa förmågor, finns det sätt att bedöma kreativitet inom olika domäner som kan användas för att besvara frågor om domängeneralitet/specificitet. Men de typer av tester som behövs är inte de billiga, lätta att administrera och objektivt bedömningsbara domängenerella tester som länge har dominerat bedömningen av kreativitet.
Tester av divergent tänkande var under många år det mest använda måttet på kreativitet. I en genomgång 1984 av all publicerad kreativitetsforskning stod Torrance-testerna, som inte är de enda testerna för divergent tänkande som används, men som säkerligen är de mest använda, för tre fjärdedelar av all kreativitetsforskning som omfattade elever och 40 % av den mindre delmängd av all kreativitetsforskning som omfattade vuxna som försökspersoner (Torrance & Presbury, 1984). Torrance-testerna och andra tester för divergent tänkande är baserade på Guilfords (1956) modell Structure of the Intellect, där han hävdade att ”divergent produktion” – att tänka på en mängd olika idéer som svar på en öppen fråga eller uppmaning – var en viktig bidragande faktor till kreativitet. När Guilford definierade divergent produktion (som betyder samma sak som divergent tänkande, en term som Guilford också använde; divergent tänkande är den term som används mest idag), gjorde Guilford en tydlig åtskillnad mellan divergent och konvergent tänkande:
I tester med konvergent tänkande måste examinanden komma fram till ett rätt svar. Den information som ges är i allmänhet tillräckligt strukturerad så att det bara finns ett rätt svar. . . . . n exempel med verbalt material skulle vara: ”Vad är motsatsen till hårt? Vid divergent tänkande måste den som tänker göra mycket letande, och ofta räcker ett antal svar eller önskas ett antal svar. Om du ber examinanden att nämna alla saker han kan komma på som är hårda, också ätbara, också vita, har han en hel klass av saker som kan duga. Det är i kategorin divergent tänkande som vi finner de förmågor som har störst betydelse för kreativt tänkande och uppfinningar. (Guilford, 1968, s. 8)
Torrance, vars namngivna Torrance-test för kreativt tänkande i själva verket är test för divergent tänkande (dessa test kommer att diskuteras i detalj längre fram), gjorde ett liknande påpekande:
Lärande genom auktoritet tycks i första hand involvera sådana förmågor som igenkänning, minne och logiskt resonemang – vilka för övrigt är de förmågor som oftast bedöms i traditionella intelligenstester och mätningar av skolastisk lämplighet. Att lära sig kreativt genom kreativa och problemlösande aktiviteter kräver däremot, förutom igenkänning, minne och logiskt resonemang, . . . utvärdering . . . ., avvikande produktion . . . och omdefiniering. (Torrance, 1970, s. 2)
Fyra aspekter av divergent tänkande nämns ofta i litteraturen:
–
Flödighet är det totala antalet svar på ett givet stimuli, ”det totala antalet idéer som ges på en divergent tankeövning”. (Runco, 1999a, s. 577)
–
Originalitet är särprägeln hos svaren på ett givet stimuli, ”det ovanliga … hos en undersökningsdeltagares eller respondents idéer”. (Runco, 1999a, s. 577)
–
Flexibilitet är antalet olika kategorier eller typer av svar på ett givet stimuli, eller mer allmänt, ”en förändring i betydelsen, användningen eller tolkningen av något”. (Guilford, 1968, s. 99)
–
Utveckling är utvidgningen eller breddningen av idéer i ens svar på ett givet stimuli, ”detaljrikedomen i de idéer man producerar”. (Baer, 1997a, s. 22)
En färsk bok om bedömning av kreativitet illustrerade dessa med följande scenario:
Om en person skulle planera en social tillställning på en restaurang för att fira ett speciellt tillfälle, skulle hon kanske vilja ta fram en lista över möjliga platser. Hon kan ta fram en lista med 50 möjliga restauranger (hög flytbarhet), en lista som innehåller restauranger som hennes vänner troligen inte skulle tänka på (hög originalitet), en lista med ett brett utbud av olika typer av restauranger (hög flexibilitet) eller en lista som endast innehåller indiska restauranger, men som listar alla möjliga sådana inrättningar i området (hög utarbetande). (Kaufman, Plucker, & Baer, 2008a, s. 18)
De flesta tidiga tester av kreativitet var i huvudsak divergent-tänkande tester, som under många år hade mycket liten konkurrens förutom med varandra. Deras senioritet är förmodligen en av anledningarna till att testerna har använts i så stor utsträckning, men de hade också andra fördelar. De utgjorde en praktisk parallell till IQ-tester med ett enda tal (även om dess förespråkare, inklusive Torrance själv, ofta argumenterade mot en sådan konceptualisering; Kim, Cramond, & Bandalos, 2006); testerna är enkla att administrera, även till små barn; och idén om divergent tänkande, som de bygger på, är lätt att förstå och har en stark intuitiv dragningskraft (Baer, 1993; Kaufman m.fl, 2008a; Kim, 2008; Runco, 1999a; Torrance, 1993; Torrance & Presbury, 1984; Wallach & Wing, 1969).
Divergent tänkande, som konceptualiserats som en komponent i kreativt tänkande, förblir ett viktigt begrepp bland kreativitetsforskare och ligger till grund för några av de vanligaste aktiviteterna för kreativitetsträning (t.ex. brainstorming, även om brainstorming föregick Guilfords upptäckt av divergent produktion med ett par år; Guilford, 1956; Osborn, 1953). Divergent tänkande kan betraktas som antingen domängenerellt eller domänspecifikt, men det är betydligt vanligare att det betraktas som en domängenerell färdighet. I den mån kreativitet är domänspecifik kan dock inte domängenerella teorier om divergent tänkande vara giltiga utan måste ersättas av domänspecifika versioner.
Domänspecifikt divergent tänkande fungerar exakt likadant som domängenerellt divergent tänkande när det gäller att producera en rad möjliga svar på en öppen uppmaning (och flödet, flexibiliteten, originaliteten och utarbetandet förblir nyckelkomponenter i divergent tänkande under domänspecificitet). Skillnaden är helt enkelt att de färdigheter i divergent tänkande som främjar kreativitet inom ett område skiljer sig från de färdigheter i divergent tänkande som leder till kreativitet inom andra områden (t.ex, att kunna tänka på många olika och ovanliga sätt att förklara division med bråk kan leda till kreativitet i matematikundervisningen men har litet värde inom andra områden, t.ex. skulptur, komposition av musik eller historieundervisning).
Då divergerande tänkande kan konceptualiseras som ett stort antal domänspecifika färdigheter snarare än som en enda, domängenerell färdighet, kräver acceptans av domänspecificitet inte att forskare inom kreativitetsforskningen överger divergerande tänkande som en viktig bidragande faktor till kreativitet. Domänspecificitet hävdar att användningen av domängenerella tester av divergerande tänkande inte kan vara giltiga, men att domänspecifika tester fortfarande skulle kunna utformas och användas om man behövde dem för något särskilt ändamål, vilket man skulle kunna göra inom kreativitetsforskningen. Domänspecificitet förändrar också hur man måste gå tillväga för att lära människor att bli mer kreativa, men även när man lär ut sådana färdigheter i kreativt tänkande direkt, vilket kommer att visas i kapitel 6 om kreativitetsträning, kan divergent tänkande vara lika viktigt enligt en domänspecifik tolkning; det behöver bara tillämpas på ett något annorlunda sätt, vilket kommer att påverka vilka typer av uppmaningar och träningsaktiviteter man kan välja. Det är förmodligen sant att någon form av divergent tänkande (antingen i dess generiska domängenerella version eller dess nyare domänspecifika konceptualisering) förmodligen är en del av kreativt tänkande – det är en empirisk fråga vars svar har blivit något grumlat av användningen av förment (men i själva verket inte riktigt) domängenerell utbildning och testning av divergent tänkande – även om det inte längre verkar troligt att det är den enda eller primära ingrediensen som man ibland har antagit tidigare (Amabile, 1996; Kaufman, 2009; Kaufman & Baer, 2005a, 2006; Simonton, 2010a; Sternberg, 1999).
Tyvärr är det den domängenerella versionen av divergent tänkande som ligger till grund för några av de mest använda kreativitetstesterna. Domänspecificitet ifrågasätter användningen av sådana tester och utmanar giltigheten av forskningsresultat som har baserats på dessa tester. När det gäller val av åtgärder som ska användas vid forskning om domängeneralitet/specificitet utgör tester för divergent tänkande ett särskilt problem eftersom domängeneralitet är ett inbyggt antagande i testerna. Det finns till exempel två olika versioner av Torrance-testerna, en figurell och en verbal, men båda används rutinmässigt som domängenerella tester.
Var och en av de två Torrance-testerna rapporterar olika delpoäng. Det har skett många förändringar i dessa delpoäng under årens lopp, men som ett exempel kan nämnas att det figurella testet för närvarande hävdar att det ”bedömer fem mentala egenskaper” och 13 ”kreativa styrkor” (Scholastic Testing Service, 2013). Det finns också ett övergripande ”kreativitetsindex”, men Torrance varnade själv för alla tolkningar av hans test med enstaka siffror:
Torrance har avrått från att använda sammansatta poäng för TTCT. Han varnade för att det kan vara vilseledande att använda en enda poäng som en sammansatt poäng eftersom varje poäng på en delskala har en oberoende betydelse. (Kim et al., 2006, s. 461)
Torrance fann också att hans två domänspecifika tester av divergent tänkande i huvudsak var okorrelerade:
Svar på de verbala och figurala formerna av TTCT uttrycks inte bara i två olika modaliteter … utan de är också mått på olika kognitiva förmågor. Faktum är att Torrance (1990) fann mycket liten korrelation (r = 0,06) mellan prestationer på de verbala och figurala testerna. (Cramond et al., 2005, s. 283-284)
Torrances varningar har dock fallit för döva öron. Delskalepoäng som mäter olika aspekter av divergent tänkande ignoreras rutinmässigt till förmån för övergripande kreativitetsindexpoäng, särskilt av program för begåvade/begåvade, som är de mest aktiva användarna av Torrance-testerna (Scholastic Testing Service, 2013), och forskare hävdar nu ofta att det övergripande kreativitetsindexet är den bästa förutsägelsen av kreativ förmåga (t.ex, Plucker, 1999; Yamada & Tam, 1996).
Det faktum att Torrance skapade två olika domänspecifika tester av divergent tänkande och fann att de i huvudsak var ortogonala och därför mäter två mycket olika förmågor (Cramond et al., 2005) har naturligtvis orsakat problem för dem som har använt båda testerna i samma studie och tolkat dem båda som mått på domängenerell kreativitet. I en nyligen genomförd studie som syftade till att validera Torrance-testerna fann man till exempel att ett av testerna korrelerade med viktiga resultatmått, men att det andra inte gjorde det. I det fallet förutspådde poäng för verbalt divergent tänkande många av de saker som i studien hade använts som bevis på kreativa prestationer (saker som försökspersonerna hade självrapporterat som personliga prestationer från en checklista över kreativa prestationer), men poäng för figurellt divergent tänkande gjorde inte det. Som författaren förklarade:
Den verbala DT:s betydelse i förhållande till den figurala DT:n kan bero på en språklig bias i checklistorna över kreativa prestationer för vuxna. Om till exempel en majoritet av de kreativa prestationerna krävde en hög grad av språklig talang, i motsats till rumslig talang eller talang för problemlösning, skulle de verbala DT-testerna förväntas ha en betydligt högre korrelation med dessa typer av prestationer än andra former av DT. (Plucker, 1999, s. 110)
Detta resultat är precis vad domänspecificitetsteorin skulle förutsäga. Olika mått på kreativitet som är förankrade i olika domäner kommer att förutsäga kreativa prestationer endast inom sina respektive domäner. Tyvärr har denna typ av resultat (inklusive resultaten från testens skapare) inte fått dem som marknadsför Torrance-testerna att dra ner på sina påståenden. Både den figurala och den verbala formen av testet utger sig för att vara allmänna test av kreativitet (Scholastic Testing Service, 2013).
Då divergerande tanketest som Torrance-testet utgår från domängeneralitet kan de knappast användas i studier vars syfte är att testa om kreativitet är domängenerellt eller domänspecifikt (även om resultaten från testerna, trots att de utger sig för att vara domängenerella, ger belägg för att kreativitet är domänspecifikt, som t.ex. det som Torrance själv erbjöd, Cramond et al. 2005). För den typen av forskning behövs en bedömningsteknik som är agnostisk i fråga om domängeneralitet/specificitet.
Tyvärr har divergent tänkande inte längre vare sig den typ av monopol som det en gång åtnjöt inom kreativitetsteori och testning eller den breda respekt som det en gång skapade bland kreativitetsteoretiker och -forskare. Andra kreativitetstester har utvecklats, och även om ingen av dem har fått den typ av nästan universell acceptans som Torrance-testerna (och andra tester av divergent tänkande) en gång hade, ger de andra möjligheter som forskningsverktyg.
En nyligen utgiven bok om bedömning av kreativitet (Kaufman et al., 2008a) innehöll kapitel om fyra typer av kreativitetsmått: divergent tänkande, bedömningar av andra (lärare, kamrater, föräldrar), självbedömningar och ett förfarande som kallas Consensual Assessment Technique (CAT), där experter bedömer kreativiteten hos saker som människor har skapat (dikter, konstverk, teorier, pussel, sufflés, reklam, föreställningar av alla slag; det kan användas för nästan vad som helst).
Att andra gör bedömningar och självbedömningar kräver inget antagande om vare sig domängeneralitet eller domänspecificitet, men det sätt på vilket bedömningarna är strukturerade kan (och gör ofta) lägga till ett sådant antagande. Om man frågar om X:s kreativitet som arkitekt görs inget antagande om vare sig domängeneralitet eller domänspecificitet. (Om kreativitet i själva verket är ett allmänt område, skulle X:s kreativitet inom arkitektur naturligtvis tala för X:s kreativitet i allmänhet. Men genom att ställa frågor om X:s kreativitet inom arkitekturen tillåts endast en allmän domän – det förutsätts inte – och det tillåts likafullt att kreativiteten kan vara domänspecifik). Men om man helt enkelt frågar hur kreativ X är, förutsätter frågan att svaret kommer att gälla X mer generellt. En allmän fråga ”Hur kreativ är X?” förutsätter därför att det finns en allmän domän och kan därför inte vara till hjälp för en forskare som försöker fastställa hur allmän eller specifik kreativitet är för en domän. Tyvärr har frågorna i de flesta fall där forskare har ställt frågor om andras kreativitet utformats på ett sätt som kräver domängenerella svar och är därför föga användbara för att lösa tvister om domängeneralitet/specificitet.
Självbedömningar av kreativitet liknar bedömningar av andra i det avseendet att man kan ställa frågor om kreativitet i allmänhet (och därmed utgå från domängeneralitet) eller om kreativitet inom specifika domäner (och därmed inte utgå från några antaganden om generalitet/specificitet). Studier av detta slag har tenderat att visa en hel del domänspecificitet (vilket diskuteras i kapitel 2), men denna teknik har två stora svagheter:
Självbedömningar i allmänhet, och självbedömningar av kreativitet i synnerhet, tenderar att ha begränsad validitet. (Vissa skulle till och med kunna gå ännu längre och hävda att de inte har någon validitet alls, men i vilket fall som helst – med antingen mycket begränsad validitet eller ingen validitet alls – är de betydligt sämre forskningsverktyg än idealiska).
Och även om människor tenderar att betygsätta sig själva olika inom olika områden när de ombeds att bedöma sin egen kreativitet på olika områden, skulle man kunna hävda att även om sådana frågor faktiskt inte utgår från domänspecificitet, så skulle de kunna ha en tendens att driva svaren i den riktningen. Om kreativiteten skulle vara domänspecifik, varför skulle man då fråga om kreativiteten på många olika områden? Det skulle kunna tyckas för respondenterna att de som ställer frågorna faktiskt utgår från domänspecificitet.
Självbedömningar och andras bedömningar har alltså inte varit särskilt användbara när det gäller att besvara frågor om domängeneralitet/specificitet. Tester för divergent tänkande utgår vanligtvis från domängeneralitet; även om de inte behöver göra det, gör faktiskt alla allmänt använda tester för divergent tänkande – även sådana som Torrance som bär de domänbaserade etiketterna figurell och verbal – detta antagande och uppmuntrar till en domängenerell tolkning. Tester för divergent tänkande har också det problemet att bevisen för att tester för divergent tänkande är giltiga som mått på kreativitet i bästa fall är ganska svaga. Som redan nämnts handlade den första debatten som sponsrades av American Psychological Associations division 10 (Psychology of Aesthetics, Creativity and the Arts) om giltigheten hos tester för divergent tänkande som Torrance-testerna (Baer, 2009; Kim, 2009), vilket tyder på att det är en öppen fråga. (Debattens titel var ”Are the Torrance Tests of Creative Thinking Still Relevant in the 21st Century?”). Så även om man kunde hitta ett sätt att använda tester för divergent tänkande för att mäta kreativitetens domängeneralitet/specificitet (t.ex. genom att ge försökspersoner tester för divergent tänkande inom olika domäner och jämföra resultaten, något som Torrance själv gjorde, med resultat som tydligt pekade på domänspecificitet; Cramond m.fl, 2005), skulle frågor om giltigheten av tester för divergent tänkande (även områdesspecifika tester för divergent tänkande) undergräva förtroendet för de erhållna resultaten.
Det lämnar den andra primära metoden för bedömning av kreativitet, CAT (Amabile, 1982, 1983, 1996198219831996). CAT bedömer kreativitet på alla nivåer (oavsett om det handlar om den vanliga lilla kreativiteten som till och med barn uppvisar eller den paradigmskiftande stora kreativiteten hos de mest originella och inflytelserika tänkarna inom sina områden) på samma sätt som kreativitet oftast bedöms i den verkliga världen – genom åsikter från experter inom det relevanta området. Precis som Nobelpristagarna väljs ut av paneler med experter inom varje område som bedömer kreativiteten i bidragen till deras respektive områden, använder CAT experter inom ett område för att bedöma kreativiteten hos faktiska produkter inom det området. Experternas bedömningar kan naturligtvis förändras med tiden; normerna inom alla områden, vare sig de är konstnärliga, vetenskapliga eller praktiska, är inte oföränderliga, och det som kan betraktas som kreativt i en viss tid kan betraktas som mindre värdefullt i en annan tid (och vice versa), vilket också gäller för experternas kvalifikationer inom alla områden. Men den bästa möjliga uppskattningen av kreativiteten hos en produkt vid en viss tidpunkt är den kollektiva bedömningen av de erkända experterna på området. Det finns helt enkelt ingen bättre mätare tillgänglig (Baer & McKool, 2009, 201420092014).
De experter som gör kreativitetsbedömningar i en CAT-bedömning gör sina bedömningar oberoende av varandra – det finns ingen möjlighet för dem att påverka varandras åsikter – vilket gör det möjligt att kontrollera reliabiliteten mellan bedömare, som i allmänhet är ganska god. Det behövs naturligtvis olika experter beroende på vilka artefakter som ska bedömas. Poeter, poesikritiker och poesilärare kan fungera som domare om artefakterna i fråga är haiku-dikter, medan konstnärer, konstkritiker och konstlärare skulle vara lämpliga om artefakterna är collage. Varje expert ombeds att individuellt bedöma kreativiteten hos varje produkt i studien i förhållande till alla andra i urvalet och inte i jämförelse med någon extern standard. Alla bedömningar är relativa till kreativiteten hos de andra artefakterna i den grupp som bedöms. En skala av Likert-typ används så att poängen sprids över ett antal möjliga bedömningar, och bedömarna uppmuntras att använda hela skalan och att ge de mest kreativa artefakterna i gruppen det högsta betyget och de minst kreativa det lägsta betyget, i syfte att särskilja den jämförande kreativiteten bland artefakterna i gruppen. Medelbetyg från alla bedömare (som kan vara 10-15 i en typisk studie) används som kreativitetspoäng för varje artefakt (Amabile, 1996; Baer, Kaufman, & Gentile, 2004; Kaufman et al., 2008a).
Processen är både enkel och okomplicerad, även om enkel tyvärr inte innebär att den är vare sig lätt eller billig. Till skillnad från de collegestudenter som utgör ämnespoolen för en stor del av den psykologiska forskningen är experter inte lika fritt tillgängliga. Det behövs olika typer av experter beroende på vilka artefakter som ska bedömas, och experterna får vanligtvis betalt för sitt arbete. Vissa studier har visat att kvasiexperter inom vissa områden (t.ex. studenter inom ett område som ännu inte kan kvalificera sig som experter) ger bedömningar som liknar experternas, vilket kan minska kostnaderna något. Användning av nybörjarbedömare (t.ex. collegestudenter) ger dock sällan samma slags bedömningar som experter, så CAT kräver i allmänhet bedömare med åtminstone en blygsam nivå av expertis inom området i fråga och är därför dyrare än många andra metoder för bedömning av kreativitet (Kaufman, Baer, & Cole, 2009b; Kaufman, Baer, Cole, & Sexton, 2008b; Kaufman, Baer, Cropley, Reiter-Palmon, & Sinnett, 2013a).
CAT är något resurskrävande, men den har många fördelar och har kallats ”guldstandard” för bedömning av kreativitet (Carson, 2006). Den långsiktiga stabiliteten hos enskilda CAT-bedömningar är lika god som den långsiktiga stabiliteten hos resultat på väletablerade, divergerande tanketest med flera punkter (t.ex. ligger test-retestkorrelationerna efter ett år i båda fallen i intervallet 0,50 med försökspersoner i grundskoleåldern), och om flera kreativa produkter av samma typ skapas och bedöms i både för- och eftertestning visar CAT:s långsiktiga stabilitet ännu bättre resultat (Baer, 1994c; Kogan, 1983). CAT kan användas för att bedöma kreativiteten hos artefakter inom nästan vilket område som helst, och till skillnad från divergent tänkande och andra tester av delkompetenser som teoretiserats vara förknippade med kreativitet, bedömer CAT faktiska kreativa prestationer och är därför inte beroende av acceptans eller giltighet av någon särskild kreativitetsteori. CAT undviker också haloeffekter och andra personliga fördomar som kan störa bedömningar av kreativitet av andra eller av en själv. Även om bedömningarna handlar om kreativiteten hos artefakter inom ett visst område, görs inga antaganden när CAT används om kreativitetens domänspecifika eller generella karaktär. Det är inte kopplat till någon teori om kreativitetens natur och är helt neutralt när det gäller frågor om domänens generalitet/specificitet, vilket gör det till ett idealiskt mått på kreativitet på detta område.
I kapitel 2 kommer vi att gå igenom forskningen om kreativitetens domänspecificitet och generalitet i detalj, och i en stor del av den används CAT. Resultaten har varit ganska konsekventa när det gäller att visa liten domängeneralitet. En viktig forskningsmetod har varit att ge försökspersoner ett antal olika uppgifter inom olika områden (t.ex. skapa ett collage, skriva en dikt, skriva en berättelse), låta paneler av experter inom respektive område oberoende av varandra betygsätta dessa produkter med avseende på kreativitet med hjälp av CAT, och sedan leta efter korrelationer mellan betygsättningarna inom olika områden. De två konkurrerande teorierna – domängeneralitet och domänspecificitet – ger olika förutsägelser om den faktiska kreativa prestationen. Så här sammanfattar en kreativitetsforskare kortfattat hur dessa förutsägelser skulle skilja sig åt:
Domängeneralitet skulle stödjas av höga interkorrelationer mellan olika kreativa beteenden … medan domänspecificitet skulle stödjas av relativt låga korrelationer mellan olika beteenden. (Ivcevic, 2007, s. 272)
De korrelationer som rapporterats i de många studier som har gjort just denna jämförelse har tenderat att sväva runt noll (särskilt om varians som kan hänföras till intelligens avlägsnas; i kapitel 2 granskas denna forskning i detalj, men se Baer, 2010, 201320102013 för sammanfattningar), och till och med författare som har påstått att de har funnit en viss grad av domängeneralitet finner den vanligen bara inom domäner. Conti, Coon och Amabile (1996) rapporterade till exempel korrelationer mellan kreativitetsbedömningar på flera uppgifter för att skriva noveller som varierade från 0,43 till 0,87 och några mindre, men ändå statistiskt signifikanta, korrelationer mellan flera olika konstuppgifter (konstuppgifterna liknade varandra mindre än skrivuppgifterna, så detta resultat var väntat). Dessa resultat är dock alla korrelationer inom en domän och visar därför endast att det inom en domän (t.ex. novellskrivning eller konst) finns en viss generalitet, vilket både domänspecificitet och domängeneralitet förutsäger. I motsats till de många statistiskt signifikanta korrelationerna inom en domän är dock de 13 korrelationer mellan olika domäner (skrivande och konst) som rapporterats – de korrelationer som har betydelse för domänspecificiteten – alla mycket små och oavsett om de är positiva eller negativa var ingen av dem statistiskt signifikant. Så trots dessa författares påståenden om bevis för domängeneralitet var allt de faktiskt fann generalitet inom en domän (dvs. domänspecificitet).
Feist (2004) kommenterade att det är en ”tilltalande, och i slutändan fast amerikansk, föreställning att en kreativ person skulle kunna vara kreativ inom vilken domän han eller hon än väljer. Allt personen skulle behöva göra skulle vara att bestämma sig för var hon eller han skulle använda sina talanger och ansträngningar, öva eller träna mycket, och voilà, du har en kreativ prestation. Enligt detta synsätt är talang viktigare än område, och det är verkligen något godtyckligt inom vilket område den kreativa prestationen kommer till uttryck.” Även om det är tilltalande drog Feist slutsatsen att ”detta är en ganska naiv och i slutändan falsk ståndpunkt och att kreativ talang i själva verket är domänspecifik … kreativitet och talang är vanligen inte bland domängenerella färdigheter” (s. 57).2
Efter att ha gått igenom bevisen för och emot domänspecificering i kapitel 2, utforskar kapitlen 3-63456 vad dessa forskningsresultat innebär för kreativitetsteorier, kreativitetsforskning, kreativitetstestning och kreativitetsträning, följt av en titt på vilka typer av kreativitetsteorier som skulle vara livskraftiga under domänspecificering. Även om läsarna uppmanas att läsa igenom alla dessa kapitel i tur och ordning har de skrivits med tanke på att många läsare kommer att ha ett särskilt intresse för bara ett eller några av kapitlen. Att hoppa över kapitel bör inte leda till någon större förvirring (även om det har krävts en tillfällig upprepning av vissa nyckelidéer och forskningsresultat för att skriva dem på ett sätt som gör detta möjligt). Läsare som redan är bekanta med (och övertygade av) de forskningsresultat som stöder domänspecificitet, till exempel, kanske vill hoppa över den omfattande granskningen av dessa resultat i kapitel 2, som mer detaljerat behandlar en del av de resultat som kortfattat redovisas i detta kapitel.