Hoe wordt creativiteit gemeten?
Onderzoek naar creativiteit is belemmerd door het gebrek aan goede maatstaven voor creativiteit. Hoofdstuk 5 bevat een discussie over onderzoek naar domeinspecifieke middelen voor creativiteitstesten. Wat ik nu moet uitleggen is (ongeveer) het tegenovergestelde: wat creativiteit testen betekent voor onderzoek naar domeinspecificiteit.
Helaas maken de manieren waarop creativiteit meestal is getest en de aannames die veel creativiteitstesten maken die testen ongeschikt om te gebruiken bij het bepalen of creativiteit domeinspecifiek of domein-generalistisch is. Zelfs als de meest gebruikte tests geldig zouden zijn, wat ze voor het grootste deel niet zijn, dan nog zouden ze niet bruikbaar zijn voor het beoordelen van vragen over domeingeneraliteit en domeinspecificiteit omdat het gewoon de verkeerde soort tests zijn. De situatie is vergelijkbaar met het gedwongen gebruik van een spellingtest om te bepalen of muzikale, wiskundige, artistieke, atletische en verbale vaardigheden met elkaar verband houden. Deze vijf soorten vaardigheden kunnen al dan niet met elkaar in verband staan, en er zijn onderzoeksontwerpen die kunnen helpen om na te gaan of er een verband is. Maar zelfs een goed onderbouwde, geldige spellingtest, op zichzelf gebruikt, zou van weinig nut zijn bij het beantwoorden van vragen over mogelijke verbanden tussen deze verschillende soorten vaardigheden.
De situatie is moeilijk, maar niet hopeloos. Net zoals men scores op afzonderlijke tests van muzikale, wiskundige, artistieke, atletische en verbale bekwaamheden zou kunnen gebruiken om na te gaan welke onderlinge verbanden er tussen deze bekwaamheden zouden kunnen bestaan, zijn er manieren om creativiteit in verschillende domeinen te beoordelen die kunnen worden gebruikt om vragen over domeingeneraliteit/specificiteit te beantwoorden. Maar het soort tests dat nodig is, zijn niet de goedkope, gemakkelijk af te nemen, en objectief te scorren domein-algemene tests die lange tijd de beoordeling van creativiteit hebben gedomineerd.
Tests van divergent denken waren vele jaren de meest gebruikte maatstaf van creativiteit. In een 1984 overzicht van alle gepubliceerde creativiteit onderzoek, de Torrance-tests, die niet de enige tests van divergent denken in gebruik, maar zeker de meest gebruikte, goed voor driekwart van alle creativiteit onderzoek met studenten en 40% van de kleinere subset van alle creativiteit onderzoek met volwassenen als proefpersonen (Torrance & Presbury, 1984). De Torrance-tests en andere divergent-denken-tests zijn gebaseerd op Guilfords (1956) Structure of the Intellect-model, waarin hij betoogde dat “divergente productie” – het denken aan een grote verscheidenheid van ideeën in antwoord op een open vraag of prompt – een belangrijke bijdrage leverde aan creativiteit. Bij het definiëren van divergente productie (wat hetzelfde betekent als divergent denken, een term die Guilford ook gebruikte; divergent denken is de term die tegenwoordig meer wordt gebruikt), maakte Guilford een duidelijk onderscheid tussen divergent en convergent denken:
Bij convergent-denktests moet de examinandus tot één juist antwoord komen. De gegeven informatie is over het algemeen voldoende gestructureerd zodat er maar één juist antwoord is. . n voorbeeld met verbaal materiaal zou zijn: “Wat is het tegenovergestelde van hard?” Bij divergent denken moet de denker veel zoekwerk verrichten, en vaak is een aantal antwoorden voldoende of gewenst. Als je de examinandus vraagt om alle dingen te noemen die hij kan bedenken die hard zijn, ook eetbaar, ook wit, dan heeft hij een hele klasse van dingen die zouden kunnen voldoen. Het is in de divergent-denk categorie dat we de bekwaamheden vinden die het meest significant zijn in creatief denken en uitvinden. (Guilford, 1968, p. 8)
Torrance, wiens gelijknamige Torrance Tests of Creative Thinking eigenlijk tests van divergent denken zijn (deze tests zullen later in enig detail worden besproken), maakte een soortgelijk punt:
Leren op gezag lijkt hoofdzakelijk vaardigheden te betreffen als herkennen, geheugen en logisch redeneren – wat overigens de vaardigheden zijn die het vaakst worden beoordeeld door traditionele intelligentietests en maatstaven van schoolse bekwaamheid. In tegenstelling hiermee vereist creatief leren door middel van creatieve en probleemoplossende activiteiten, naast herkenning, geheugen en logisch redeneren, . . evaluatie . . ., divergente productie . . ., en herdefiniëring. (Torrance, 1970, p. 2)
Vier aspecten van divergent denken worden vaak genoemd in de literatuur:
–
Fluency is het totale aantal reacties op een gegeven stimuli, “the total number of ideas given on any one divergent thinking exercise.” (Runco, 1999a, p. 577)
–
Originaliteit is het onderscheidend vermogen van antwoorden op een gegeven stimuli, “de ongewoonheid … van de ideeën van een examinandus of respondent.” (Runco, 1999a, p. 577)
–
Flexibiliteit is het aantal verschillende categorieën of soorten reacties op een gegeven stimuli, of ruimer, “een verandering in de betekenis, het gebruik, of de interpretatie van iets.” (Guilford, 1968, p. 99)
–
Elaboratie is de uitbreiding of verbreding van ideeën in iemands reacties op een gegeven stimuli, “the richness of detail in the ideas one produces.” (Baer, 1997a, p. 22)
Een recent boek over creativiteitsbeoordeling illustreerde dit met het volgende scenario:
als een persoon een sociale gelegenheid in een restaurant zou plannen om een speciale gelegenheid te vieren, zou ze misschien een lijst van mogelijke locaties willen produceren. Ze kan een lijst maken met 50 mogelijke restaurants (hoge vloeiendheid), een lijst met restaurants waar haar vrienden waarschijnlijk niet aan zouden denken (hoge originaliteit), een lijst met een breed scala aan soorten restaurants (hoge flexibiliteit), of een lijst met alleen Indiase restaurants maar met alle mogelijke restaurants in de buurt (hoge uitwerking). (Kaufman, Plucker, & Baer, 2008a, p. 18)
De meeste vroege creativiteitstests waren in wezen divergent-denktests, die vele jaren zeer weinig concurrentie kenden, behalve van elkaar. Hun anciënniteit is waarschijnlijk een van de redenen waarom de tests zo algemeen zijn gebruikt, maar ze hadden ook andere voordelen. Ze boden een handige parallel voor IQ-testen met één getal (hoewel de voorstanders ervan, waaronder Torrance zelf, vaak tegen een dergelijke conceptualisering pleitten; Kim, Cramond, & Bandalos, 2006); de testen zijn eenvoudig af te nemen, zelfs bij jonge kinderen; en het idee van divergent denken waarop ze zijn gebaseerd is gemakkelijk te begrijpen en heeft een sterke intuïtieve aantrekkingskracht (Baer, 1993; Kaufman et al., 2008a; Kim, 2008; Runco, 1999a; Torrance, 1993; Torrance & Presbury, 1984; Wallach & Wing, 1969).
Divergent denken, geconceptualiseerd als een component van creatief denken, blijft een belangrijk concept onder creativiteitsonderzoekers en is de basis van enkele van de meest voorkomende creativiteitstrainingsactiviteiten (zoals brainstorming, hoewel brainstorming een paar jaar voorafging aan Guilfords ontdekking van divergente productie; Guilford, 1956; Osborn, 1953). Divergent denken kan zowel als domein-general als domeinspecifiek beschouwd worden, maar de opvatting als een domein-generalistische vaardigheid is veel gebruikelijker. In de mate dat creativiteit domeinspecifiek is, echter, kunnen domein-algemene theorieën van divergent denken niet geldig zijn en moeten ze vervangen worden door domeinspecifieke versies.
Domeinspecifiek divergent denken werkt precies hetzelfde als domein-algemeen divergent denken in het produceren van een reeks mogelijke antwoorden op een open vraag (en vloeiendheid, flexibiliteit, originaliteit, en elaboratie blijven belangrijke componenten van divergent denken onder domeinspecificiteit). Het verschil is gewoon dat de divergent-denkvaardigheden die creativiteit in het ene domein bevorderen verschillen van de divergent-denkvaardigheden die leiden tot creativiteit in andere domeinen (bv, in staat zijn om veel verschillende en ongebruikelijke manieren te bedenken om de deling door breuken uit te leggen, kan leiden tot creativiteit in het wiskundeonderwijs, maar heeft weinig waarde in andere domeinen, zoals beeldhouwen, muziek componeren, of geschiedenisonderwijs).
Omdat divergent denken kan worden geconceptualiseerd als een grote verscheidenheid aan domeinspecifieke vaardigheden in plaats van als één enkele, domein-algemene vaardigheid, vereist de aanvaarding van domeinspecificiteit niet dat creativiteitsonderzoekers divergent denken opgeven als een belangrijke bijdrage aan creativiteit. Domeinspecificiteit stelt dat het gebruik van domein-algemene tests van divergent denken niet geldig kan zijn, maar domeinspecifieke tests kunnen nog steeds worden bedacht en gebruikt als men ze nodig heeft voor een speciaal doel, zoals men zou kunnen doen in creativiteitsonderzoek. Domeinspecificiteit verandert ook de manier waarop men mensen moet aanleren om creatiever te zijn, maar zelfs wanneer men zulke creatief-denkvaardigheden rechtstreeks aanleert, zoals zal blijken in hoofdstuk 6 over creativiteitstraining, kan divergent denken even belangrijk zijn onder een domeinspecifieke interpretatie; het moet alleen op een enigszins andere manier worden toegepast, wat een invloed zal hebben op het soort prompts en trainingsactiviteiten dat men zou kunnen kiezen. Het is waarschijnlijk waar dat een vorm van divergent denken (in zijn generieke domein-general versie of zijn meer recente domeinspecifieke conceptualisering) waarschijnlijk deel uitmaakt van creatief denken – dat is een empirische vraag waarvan het antwoord enigszins vertroebeld is door het gebruik van zogenaamd (maar in feite niet) domein-general divergent-denken training en testen – hoewel het niet langer waarschijnlijk lijkt dat het het enige of primaire ingrediënt is zoals in het verleden soms werd aangenomen (Amabile, 1996; Kaufman, 2009; Kaufman & Baer, 2005a, 2006; Simonton, 2010a; Sternberg, 1999).
Helaas is het de domein-algemene versie van divergent denken die als basis dient voor enkele van de meest gebruikte creativiteitstests. Domeinspecificiteit stelt het gebruik van dergelijke tests ter discussie en betwist de geldigheid van onderzoeksresultaten die op deze tests zijn gebaseerd. Bij het selecteren van maatregelen die gebruikt moeten worden bij onderzoek naar domeingeneraliteit/specificiteit, leveren divergent-denktests een speciaal probleem op omdat domeingeneraliteit een ingebouwde aanname van de tests is. Er zijn bijvoorbeeld twee verschillende versies van de Torrance-tests, een figurale en een verbale, maar beide worden routinematig gebruikt als domein-generalistische tests.
Elke van de twee Torrance-tests rapporteert verschillende subscores. Er zijn in de loop der jaren veel veranderingen in deze subscores geweest, maar als voorbeeld, de figurale test beweert momenteel “vijf mentale kenmerken te beoordelen” en 13 “creatieve sterke punten” (Scholastic Testing Service, 2013). Er is ook een algemene “creativiteitsindex”, maar Torrance zelf waarschuwde tegen interpretaties van zijn tests op basis van één cijfer:
Torrance heeft het gebruik van samengestelde scores voor de TTCT ontmoedigd. Hij waarschuwde dat het gebruik van een enkele score als een samengestelde score misleidend kan zijn omdat elke subscale score een onafhankelijke betekenis heeft. (Kim e.a., 2006, p. 461)
Torrance vond ook dat zijn twee domeinspecifieke tests van divergent denken in wezen niet gecorreleerd waren:
Responsen op de verbale en figurale vormen van de TTCT worden niet alleen uitgedrukt in twee verschillende modaliteiten … maar het zijn ook maatstaven voor verschillende cognitieve capaciteiten. In feite vond Torrance (1990) zeer weinig correlatie (r = .06) tussen de prestaties op de verbale en de figurale test. (Cramond et al., 2005, blz. 283-284)
De waarschuwingen van Torrance zijn echter in dovemansoren gevallen. Subschaalscores die verschillende aspecten van divergent denken meten, worden routinematig genegeerd ten gunste van de algemene creativiteitsindexscores, vooral door programma’s voor hoogbegaafden/talenten, die de meest actieve gebruikers van de Torrance-tests zijn (Scholastic Testing Service, 2013), en onderzoekers beweren nu vaak dat de algemene creativiteitsindex de beste voorspeller is van creatief vermogen (bijv, Plucker, 1999; Yamada & Tam, 1996).
Het feit dat Torrance twee verschillende domeinspecifieke tests van divergent denken creëerde en vond dat ze in wezen orthogonaal waren en daarom twee zeer verschillende vaardigheden meten (Cramond et al., 2005), heeft natuurlijk problemen veroorzaakt voor degenen die beide tests in dezelfde studie hebben gebruikt en ze allebei hebben geïnterpreteerd als metingen van domein-general creativiteit. In een recente studie, uitgevoerd met het doel de Torrance-tests te valideren, werd bijvoorbeeld vastgesteld dat een van de tests correleerde met belangrijke uitkomstmaten, maar de andere niet. In dat geval voorspelden verbale divergent-denkscores veel van het soort dingen die in de studie als bewijs van creatieve prestaties werden gebruikt (dingen die de proefpersonen zelf hadden gerapporteerd als persoonlijke prestaties uit een checklist van creatieve prestaties), maar figurale divergent-denkscores deden dat niet. Zoals de auteur verklaarde:
Het belang van verbale DT ten opzichte van figurale DT kan te wijten zijn aan een linguïstische bias in de checklists voor creatieve prestaties van volwassenen. Als bijvoorbeeld een meerderheid van de creatieve prestaties een hoge mate van linguïstisch talent vereist, in tegenstelling tot ruimtelijk talent of probleemoplossingstalent, zou men verwachten dat de verbale DT-tests een significant hogere correlatie hebben met deze soorten prestaties dan andere vormen van DT. (Plucker, 1999, p. 110)
Deze uitkomst is precies wat de domeinspecificiteitstheorie zou voorspellen. Verschillende maten van creativiteit die geworteld zijn in verschillende domeinen zullen creatieve prestaties enkel voorspellen in hun respectievelijke domeinen. Helaas hebben dit soort bevindingen (inclusief die van de maker van de testen) er niet toe geleid dat degenen die de Torrance Tests op de markt brengen hun beweringen hebben teruggeschroefd. Zowel de figurale als de verbale vorm van de test pretenderen algemene tests van creativiteit te zijn (Scholastic Testing Service, 2013).
Omdat divergent-thinking tests zoals de Torrance Tests uitgaan van domeingeneraliteit, kunnen ze moeilijk worden gebruikt in studies die als doel hebben te testen of creativiteit domeingeneraal of domeinspecifiek is (ook al leveren resultaten van tests, ondanks hun claims van domeingeneraliteit, wel bewijs, zoals dat van Torrance zelf, dat creativiteit domeinspecifiek is; Cramond et al., 2005). Voor dat soort onderzoek is een beoordelingstechniek nodig die agnostisch is ten aanzien van domeingeneraliteit/specificiteit.
Terminste heeft divergent denken niet meer het monopolie dat het ooit had in creativiteitstheorie en -testen, noch het brede respect dat het ooit genoot onder creativiteitstheoretici en -onderzoekers. Er zijn andere creativiteitstests ontwikkeld, en hoewel geen enkele daarvan de vrijwel universele acceptatie heeft verworven die de Torrance-tests (en andere divergent-denken-tests) ooit hadden, bieden ze wel andere mogelijkheden als onderzoeksinstrument.
Een recent boek over creativiteitsbeoordeling (Kaufman et al., 2008a) bevatte hoofdstukken over vier soorten creativiteitsmetingen: divergent denken, beoordelingen door anderen (leraren, medeleerlingen, ouders), zelfbeoordelingen, en een procedure die de Consensual Assessment Technique (CAT) wordt genoemd, die deskundigen gebruikt om de creativiteit te beoordelen van dingen die mensen hebben gemaakt (gedichten, kunstwerken, theorieën, puzzels, soufflés, reclames, voorstellingen van welke aard dan ook; het kan voor zo ongeveer alles worden gebruikt).
Evaluaties door anderen en zelfevaluaties vereisen geen aanname van domeingrootheid of domeinspecificiteit, maar de manier waarop de evaluaties zijn gestructureerd kan (en doet vaak) zo’n aanname toevoegen. Als men vraagt naar de creativiteit van X als architect, wordt niet uitgegaan van domeingeneraliteit of domeinspecificiteit. (Als creativiteit in feite een algemeen domein is, dan zou de creativiteit van X in de architectuur natuurlijk spreken over de creativiteit van X in het algemeen. Maar vragen naar de creativiteit van X in de architectuur staat alleen domeingeneraliteit toe – het veronderstelt die niet – en het staat evenzeer toe dat creativiteit domeinspecifiek is). Maar als je gewoon vraagt hoe creatief X is, dan gaat de vraag ervan uit dat het antwoord meer algemeen op X van toepassing is. Een algemene vraag “Hoe creatief is X?” gaat dus uit van een algemeenheid van het domein, en kan als zodanig een onderzoeker niet helpen bij zijn pogingen om vast te stellen hoe domein-generalistisch of domeinspecifiek creativiteit zou kunnen zijn. Helaas zijn in de meeste gevallen waarin onderzoekers naar de creativiteit van anderen hebben gevraagd, de vragen zo geformuleerd dat ze domeingenerieke antwoorden vereisen, en als zodanig van weinig nut zijn bij het beslechten van geschillen over domeingeneraliteit/specificiteit.
Zelfbeoordelingen van creativiteit zijn vergelijkbaar met beoordelingen door anderen in die zin dat ze kunnen vragen naar creativiteit in het algemeen (en daarmee domeingeneraliteit veronderstellen) of naar creativiteit in specifieke domeinen (die geen veronderstellingen maken over generaliteit/specificiteit). Studies van dit type laten over het algemeen een grote mate van domeinspecificiteit zien (zoals besproken in hoofdstuk 2), maar deze techniek heeft twee grote zwaktes:
Zelfevaluaties in het algemeen, en zelfevaluaties van creativiteit in het bijzonder, hebben de neiging een beperkte validiteit te hebben. (Sommigen zouden zelfs kunnen beweren dat ze helemaal niet geldig zijn, maar hoe dan ook – met een zeer beperkte geldigheid of helemaal geen geldigheid – zijn het beduidend minder-dan-ideale onderzoeksinstrumenten).
Hoewel mensen die gevraagd worden hun eigen creativiteit op verschillende gebieden te beoordelen, de neiging hebben zichzelf op verschillende domeinen verschillend te beoordelen, zou men kunnen stellen dat, hoewel dergelijke vragen niet echt uitgaan van domeinspecificiteit, ze de neiging zouden kunnen hebben antwoorden in die richting te duwen. Immers, als creativiteit domeinspecifiek zou zijn, waarom zou men dan vragen naar creativiteit als op veel verschillende gebieden? Respondenten zouden de indruk kunnen krijgen dat degenen die de vragen stellen in feite uitgaan van domeinspecificiteit.
Zelfevaluaties en evaluaties door anderen zijn dus niet bijzonder nuttig gebleken om vragen over domeingeneraliteit/specificiteit te beantwoorden. Divergent-denktests gaan gewoonlijk uit van domeingeneraliteit; in feite maken alle algemeen gebruikte divergent-denktests – zelfs die van Torrance die de domein-gebaseerde labels figuraal en verbaal dragen – deze veronderstelling en moedigen ze domein-generalistische interpretatie aan, ook al is dat niet nodig. Divergentie-denktests kampen ook met het probleem dat het bewijs voor de geldigheid van divergentie-denktests als maatstaf voor creativiteit in het beste geval nogal zwak is. Zoals reeds opgemerkt, ging het eerste debat ooit gesponsord door de Division 10 (Psychology of Aesthetics, Creativity and the Arts) van de American Psychological Association over de validiteit van divergent-denktesten zoals de Torrance Tests (Baer, 2009; Kim, 2009), wat suggereert dat het een open vraag is. (De titel van het debat was “Are the Torrance Tests of Creative Thinking Still Relevant in the 21st Century?”) Dus zelfs als men een manier zou kunnen vinden om divergent-denktesten te gebruiken om de domeingeneraliteit/specificiteit van creativiteit te meten (bijvoorbeeld door proefpersonen tests van divergent-denken in verschillende domeinen te geven en de resultaten te vergelijken, iets wat Torrance zelf deed, met resultaten die duidelijk wezen op domeinspecificiteit; Cramond et al., 2005), zouden vragen over de geldigheid van divergent-denktests (zelfs domeinspecifieke divergent-denktests) het vertrouwen in de verkregen resultaten ondermijnen.
Dat laat de andere primaire methode van creativiteitsbeoordeling over, de CAT (Amabile, 1982, 1983, 1996198219831996). De CAT beoordeelt creativiteit op alle niveaus (of het nu gaat om de kleine-c-creativiteit die zelfs kinderen vertonen of de paradigmaverschuivende Big-C-creativiteit van de origineelste en invloedrijkste denkers in hun vakgebied) op dezelfde manier waarop creativiteit in de echte wereld het vaakst wordt beoordeeld – door de mening van deskundigen in het relevante domein. Net zoals Nobelprijswinnaars worden geselecteerd door panels van deskundigen op elk gebied die de creativiteit van bijdragen op hun respectieve gebieden beoordelen, zo worden in het CAT deskundigen op een gebied ingezet om de creativiteit van concrete producten op dat gebied te beoordelen. Het oordeel van de deskundigen kan natuurlijk in de loop van de tijd veranderen; de normen op welk gebied dan ook, of het nu om kunst, wetenschap of praktijk gaat, zijn niet onveranderlijk, en wat in het ene tijdperk als creatief wordt beschouwd, kan in een ander tijdperk minder hoog worden aangeslagen (en omgekeerd), evenals de kwalificaties van de deskundigen op welk gebied dan ook. Maar de best mogelijke schatting van de creativiteit van een produkt op een bepaald moment is de collectieve beoordeling van de erkende deskundigen op dat gebied. Er is gewoon geen betere maatstaf voorhanden (Baer & McKool, 2009, 201420092014).
De deskundigen die creativiteitsbeoordelingen doen in een CAT-beoordeling, vellen hun oordeel onafhankelijk – er is geen gelegenheid voor hen om elkaars mening te beïnvloeden – wat een controle van de interbeoordelaarsbetrouwbaarheid mogelijk maakt, die over het algemeen vrij goed is. Afhankelijk van de te beoordelen artefacten zijn natuurlijk verschillende deskundigen nodig. Dichters, poëziecritici en poëziedocenten zouden als juryleden kunnen fungeren als het om haikudichten gaat, terwijl kunstenaars, kunstcritici en kunstdocenten geschikt zouden zijn als het om collages gaat. Elke expert wordt gevraagd de creativiteit van elk product in de studie individueel te beoordelen in verhouding tot alle andere in de steekproef en niet in vergelijking met een externe norm. Alle beoordelingen zijn relatief ten opzichte van de creativiteit van de andere artefacten in de beoordeelde groep. Er wordt een Likert-schaal gebruikt zodat de scores worden gespreid over een reeks mogelijke beoordelingen, en de beoordelaars worden aangemoedigd de volledige schaal te gebruiken, waarbij de meest creatieve artefacten in de groep de hoogste score krijgen en de minst creatieve de laagste score, met als doel de vergelijkende creativiteit tussen de artefacten in de groep te differentiëren. De gemiddelde beoordeling van alle juryleden (die in een typische studie 10-15 kunnen tellen) wordt gebruikt als de creativiteitsscore van elk van de artefacten (Amabile, 1996; Baer, Kaufman, & Gentile, 2004; Kaufman et al., 2008a).
Het proces is zowel eenvoudig als ongecompliceerd, hoewel eenvoudig zich helaas niet vertaalt in gemakkelijk of goedkoop. In tegenstelling tot de universiteitsstudenten die de onderwerpen vormen voor zo veel van het psychologisch onderzoek, zijn deskundigen niet zo vrij beschikbaar. Er zijn verschillende soorten deskundigen nodig, afhankelijk van het soort artefacten dat moet worden beoordeeld, en de deskundigen worden meestal betaald voor hun werk. Sommige studies hebben aangetoond dat quasiexperts in sommige domeinen (zoals studenten in een vakgebied die zich nog niet als experts kunnen kwalificeren) beoordelingen produceren die vergelijkbaar zijn met die van experts, hetgeen de kosten enigszins kan drukken. Het gebruik van beginnende beoordelaars (zoals universiteitsstudenten) levert echter zelden dezelfde soort beoordelingen op als die van experts, dus de CAT vereist over het algemeen beoordelaars met ten minste een bescheiden niveau van expertise in het betreffende veld en is daarom duurder dan veel andere methoden van creativiteitsbeoordeling (Kaufman, Baer, & Cole, 2009b; Kaufman, Baer, Cole, & Sexton, 2008b; Kaufman, Baer, Cropley, Reiter-Palmon, & Sinnett, 2013a).
Het CAT is enigszins arbeidsintensief, maar het heeft veel pluspunten en wordt wel de “gouden standaard” van creativiteitsbeoordeling genoemd (Carson, 2006). De langetermijnstabiliteit van enkele CAT-beoordelingen is even goed als de langetermijnstabiliteit van scores op beproefde, multiple-item divergent-thinking tests (in beide gevallen vallen test-hertest correlaties na een jaar in de 0.50 range met basisschoolleerlingen), en als meerdere creatieve producten van hetzelfde type worden gemaakt en beoordeeld in zowel pre- als posttesting, laat de CAT-langetermijnstabiliteit nog betere resultaten zien (Baer, 1994c; Kogan, 1983). De CAT kan gebruikt worden om de creativiteit van artefacten in bijna elk domein te beoordelen, en in tegenstelling tot divergent denken en andere tests van subvaardigheden die volgens theorieën met creativiteit te maken hebben, beoordeelt de CAT feitelijke creatieve prestaties en is daarom niet afhankelijk van acceptatie of geldigheid van een bepaalde creativiteitstheorie. De CAT vermijdt ook halo-effecten en andere persoonlijke vooroordelen die de beoordeling van creativiteit door anderen of zichzelf zouden kunnen verstoren. Hoewel de oordelen gaan over de creativiteit van artefacten in een bepaald domein, wordt er bij het gebruik van de CAT geen aanname gedaan over de domeinspecificiteit of algemeenheid van creativiteit. De CAT is niet gekoppeld aan een theorie over de aard van creativiteit en is volledig neutraal ten aanzien van domeingeneraliteit/specificiteitskwesties, wat de CAT tot een ideale maatstaf maakt voor creativiteit in dit domein.
Hoofdstuk 2 geeft een gedetailleerd overzicht van onderzoek naar de domeinspecificiteit en generaliteit van creativiteit, waarvan een groot deel gebruik maakt van de CAT. De resultaten zijn vrij consistent in het aantonen van weinig domeingeneraliteit. Een belangrijke onderzoeksmethodologie is om proefpersonen een aantal verschillende taken te geven in verschillende domeinen (bijvoorbeeld een collage maken, een gedicht schrijven, een verhaal schrijven), panels van experts in de respectievelijke domeinen onafhankelijk van elkaar die producten te laten beoordelen op creativiteit met behulp van de CAT, en dan te kijken naar correlaties tussen de beoordelingen in verschillende domeinen. De twee concurrerende theorieën – domeingeneraliteit en domeinspecificiteit – doen verschillende voorspellingen over feitelijke creatieve prestaties. Een onderzoeker op het gebied van creativiteit vatte de verschillen tussen deze voorspellingen als volgt samen:
Domeingeneraliteit zou worden ondersteund door hoge intercorrelaties tussen verschillende creatieve gedragingen … terwijl domeinspecificiteit zou worden ondersteund door relatief lage correlaties tussen verschillende gedragingen. (Ivcevic, 2007, p. 272)
De correlaties die worden gerapporteerd in de vele studies die precies deze vergelijking hebben gemaakt, zweven meestal rond nul (vooral als variantie die kan worden toegeschreven aan intelligentie wordt verwijderd; Hoofdstuk 2 bespreekt dit onderzoek in detail, maar zie Baer, 2010, 201320102013 voor samenvattingen), en zelfs auteurs die hebben beweerd dat ze een zekere mate van domeingeneraliteit hebben gevonden, vinden die meestal alleen binnen domeinen. Conti, Coon, en Amabile (1996) rapporteerden bijvoorbeeld correlaties van creativiteitsbeoordelingen op verschillende schrijftaken voor korte verhalen, variërend van 0,43 tot 0,87, en enkele kleinere, maar nog steeds statistisch significante, correlaties tussen verschillende kunsttaken (de kunsttaken leken minder op elkaar dan de schrijftaken, dus dit resultaat was te verwachten). Deze resultaten zijn echter allemaal binnen-domein correlaties, en ze laten dus alleen zien dat er binnen een domein (zoals het schrijven van korte verhalen of kunst) sprake is van enige generaliteit, zoals zowel domeinspecificiteit als domeingeneraliteit voorspellen. In tegenstelling tot de vele statistisch significante correlaties binnen een domein, waren de 13 gerapporteerde domeinoverstijgende (schrijven-kunst) correlaties – die van belang zijn voor domeinspecificiteit – allemaal miniem en, positief of negatief, geen enkele was statistisch significant. Dus ondanks de bewering van deze auteurs dat ze bewijs vonden voor domeingeneraliteit, vonden ze in feite alleen maar domeininterne generaliteit (d.w.z. domeinspecificiteit).
Feist (2004) merkte op dat het een “aantrekkelijk, en uiteindelijk stevig Amerikaans, idee is dat een creatief persoon creatief zou kunnen zijn in elk domein dat hij of zij kiest. Het enige wat de persoon zou moeten doen is beslissen waar hij of zij zijn of haar talenten en inspanningen zou toepassen, veel oefenen of trainen, en voilà, je hebt creatieve prestaties. In deze visie overtroeft talent het domein, en is het werkelijk enigszins arbitrair in welk domein de creatieve prestatie tot uitdrukking komt.” Hoewel aantrekkelijk, concludeerde Feist dat “dit een nogal naïef en uiteindelijk onjuist standpunt is en dat creatief talent in feite domeinspecifiek is … creativiteit en talent behoren meestal niet tot de domein algemene vaardigheden” (p. 57).2
Na een overzicht van het bewijs voor en tegen domeinspecificiteit in hoofdstuk 2, wordt in de hoofdstukken 3-63456 onderzocht wat deze onderzoeksresultaten betekenen voor creativiteitstheorieën, creativiteitsonderzoek, creativiteitstesten en creativiteitstraining, gevolgd door een blik op welke soorten creativiteitstheorieën levensvatbaar zouden zijn onder domeinspecificiteit. Hoewel lezers worden uitgenodigd om elk van deze hoofdstukken in volgorde door te lezen, zijn ze geschreven met het begrip dat veel lezers speciale interesses zullen hebben in slechts een of een paar van de hoofdstukken. Het overslaan van hoofdstukken zou niet tot grote verwarring moeten leiden (hoewel het schrijven van de hoofdstukken op een manier die dit mogelijk maakt af en toe een herhaling van enkele belangrijke ideeën en onderzoeksresultaten heeft vereist). Lezers die al bekend zijn met (en overtuigd zijn door) het onderzoeksbewijs dat domeinspecificiteit ondersteunt, kunnen bijvoorbeeld het uitgebreide overzicht van dat bewijs in hoofdstuk 2 overslaan, dat meer in detail ingaat op een deel van het bewijs dat in dit hoofdstuk beknopter wordt gerapporteerd.