Wie wird Kreativität gemessen?
Die Forschung im Bereich der Kreativität wurde durch den Mangel an guten Kreativitätsmessungen behindert. Kapitel 5 enthält eine Diskussion über die Forschung zu bereichsspezifischen Mitteln für Kreativitätstests. Was ich jetzt erklären muss, ist (gewissermaßen) das Gegenteil: was Kreativitätstests für die Forschung zur Bereichsspezifität bedeuten.
Unglücklicherweise machen die Art und Weise, wie Kreativität am häufigsten getestet wurde, und die Annahmen, die vielen Kreativitätstests zugrunde liegen, diese Tests ungeeignet für die Bestimmung, ob Kreativität bereichsspezifisch oder bereichsübergreifend ist. Selbst wenn die am weitesten verbreiteten Tests valide wären, was sie größtenteils nicht sind, wären sie immer noch nicht nützlich, um Fragen zur Bereichsallgemeinheit und Bereichsspezifität zu beurteilen, weil sie einfach die falsche Art von Tests sind. Die Situation ist in etwa so, als wäre man gezwungen, einen Rechtschreibtest zu verwenden, um festzustellen, ob musikalische, mathematische, künstlerische, sportliche und sprachliche Fähigkeiten miteinander verwandt sind. Diese fünf Arten von Fähigkeiten können zusammenhängen oder auch nicht, und es gibt Forschungsdesigns, die dabei helfen könnten, herauszufinden, ob und wie diese Zusammenhänge aussehen könnten. Aber selbst ein gut gestützter, gültiger Rechtschreibtest wäre für sich genommen wenig hilfreich bei der Beantwortung von Fragen über mögliche Zusammenhänge zwischen diesen verschiedenen Arten von Fähigkeiten.
Die Situation ist schwierig, aber nicht hoffnungslos. Genauso wie man die Ergebnisse separater Tests für musikalische, mathematische, künstlerische, sportliche und sprachliche Fähigkeiten verwenden könnte, um zu untersuchen, welche Beziehungen zwischen diesen Fähigkeiten bestehen könnten, gibt es Möglichkeiten, Kreativität in verschiedenen Bereichen zu bewerten, die zur Beantwortung von Fragen über die Allgemeinheit/Spezifität von Bereichen verwendet werden können. Die benötigten Tests sind jedoch nicht die kostengünstigen, einfach durchzuführenden und objektiv auswertbaren bereichsübergreifenden Tests, die lange Zeit die Kreativitätsbewertung dominiert haben.
Tests zum divergenten Denken waren viele Jahre lang das am häufigsten verwendete Maß für Kreativität. In einer 1984 durchgeführten Übersicht über die gesamte veröffentlichte Kreativitätsforschung machten die Torrance-Tests, die nicht die einzigen, aber mit Sicherheit die am häufigsten verwendeten Tests für divergentes Denken sind, drei Viertel der gesamten Kreativitätsforschung mit Studenten und 40 % der kleineren Untergruppe der gesamten Kreativitätsforschung mit Erwachsenen als Probanden aus (Torrance & Presbury, 1984). Die Torrance-Tests und andere Tests zum divergenten Denken basieren auf Guilfords (1956) Structure of the Intellect-Modell, in dem er argumentierte, dass die „divergente Produktion“ – das Nachdenken über eine Vielzahl von Ideen als Antwort auf eine offene Frage oder Aufforderung – einen wesentlichen Beitrag zur Kreativität leistet. Bei der Definition der „divergenten Produktion“ (was dasselbe bedeutet wie „divergentes Denken“, ein Begriff, den auch Guilford verwendete; „divergentes Denken“ ist der heute gebräuchlichere Begriff) unterschied Guilford klar zwischen „divergentem“ und „konvergentem“ Denken:
Bei Tests zum konvergenten Denken muss der Prüfling zu einer einzigen richtigen Antwort gelangen. Die gegebenen Informationen sind in der Regel ausreichend strukturiert, so dass es nur eine richtige Antwort gibt. Ein Beispiel mit verbalem Material wäre: „Was ist das Gegenteil von hart?“ Beim divergenten Denken muss der Denker viel herumprobieren, und oft reichen mehrere Antworten aus oder sind erwünscht. Wenn man den Prüfling bittet, alle Dinge zu nennen, die ihm einfallen, die hart, essbar und weiß sind, hat er eine ganze Klasse von Dingen, die in Frage kommen. In der Kategorie des divergenten Denkens finden wir die Fähigkeiten, die für kreatives Denken und Erfindungen am wichtigsten sind. (Guilford, 1968, S. 8)
Torrance, dessen gleichnamige Torrance-Tests für kreatives Denken eigentlich Tests für divergentes Denken sind (auf diese Tests wird später noch näher eingegangen), äußerte sich in ähnlicher Weise:
Lernen durch Autorität scheint in erster Linie Fähigkeiten wie Erkennen, Gedächtnis und logisches Denken zu beinhalten – die übrigens die Fähigkeiten sind, die am häufigsten durch traditionelle Intelligenztests und Messungen der schulischen Eignung bewertet werden. Im Gegensatz dazu erfordert kreatives Lernen durch kreative und problemlösende Aktivitäten neben Erkennen, Gedächtnis und logischem Denken auch . … Bewertung …, abweichende Produktion …, und Neudefinition. (Torrance, 1970, S. 2)
Vier Aspekte des divergenten Denkens werden in der Literatur häufig erwähnt:
–
Fluency ist die Gesamtzahl der Antworten auf einen gegebenen Stimulus, „die Gesamtzahl der Ideen, die bei einer beliebigen divergenten Denkübung gegeben werden.“ (Runco, 1999a, S. 577)
–
Originalität ist die Besonderheit der Antworten auf einen bestimmten Stimulus, „die Ungewöhnlichkeit … der Ideen eines Prüflings oder Befragten.“ (Runco, 1999a, S. 577)
–
Flexibilität ist die Anzahl der verschiedenen Kategorien oder Arten von Antworten auf einen gegebenen Stimulus, oder allgemeiner ausgedrückt, „eine Veränderung in der Bedeutung, Verwendung oder Interpretation von etwas.“ (Guilford, 1968, S. 99)
–
Ausarbeitung ist die Ausdehnung oder Erweiterung der Ideen in den eigenen Reaktionen auf einen gegebenen Stimulus, „der Detailreichtum der Ideen, die man produziert.“ (Baer, 1997a, S. 22)
Ein kürzlich erschienenes Buch über Kreativitätsbeurteilung veranschaulicht dies anhand des folgenden Szenarios:
Wenn eine Person einen gesellschaftlichen Anlass in einem Restaurant planen würde, um einen besonderen Anlass zu feiern, würde sie vielleicht eine Liste möglicher Orte erstellen wollen. Sie könnte eine Liste mit 50 potenziellen Restaurants erstellen (hohe Geläufigkeit), eine Liste, die Restaurants enthält, an die ihre Freunde wahrscheinlich nicht denken würden (hohe Originalität), eine Liste mit einer breiten Palette von Restauranttypen (hohe Flexibilität) oder eine Liste, die nur indische Restaurants enthält, aber alle möglichen Einrichtungen dieser Art in der Gegend auflistet (hohe Ausführlichkeit). (Kaufman, Plucker, & Baer, 2008a, S. 18)
Die meisten frühen Kreativitätstests waren im Wesentlichen Divergent-Thinking-Tests, die über viele Jahre hinweg nur sehr wenig Konkurrenz hatten. Ihr hohes Alter ist wahrscheinlich ein Grund dafür, dass die Tests so weit verbreitet waren, aber sie hatten auch andere Vorteile. Sie boten eine bequeme Parallele zu IQ-Tests mit nur einer Zahl (obwohl ihre Befürworter, einschließlich Torrance selbst, oft gegen eine solche Konzeptualisierung argumentierten; Kim, Cramond, & Bandalos, 2006); die Tests sind einfach zu handhaben, sogar bei kleinen Kindern; und die Idee des divergenten Denkens, auf der sie basieren, ist leicht zu verstehen und hat einen starken intuitiven Reiz (Baer, 1993; Kaufman et al, 2008a; Kim, 2008; Runco, 1999a; Torrance, 1993; Torrance & Presbury, 1984; Wallach & Wing, 1969).
Divergentes Denken, das als eine Komponente des kreativen Denkens konzeptualisiert wird, ist nach wie vor ein wichtiges Konzept unter den Kreativitätsforschern und bildet die Grundlage für einige der gängigsten Kreativitätstrainingsaktivitäten (z. B. Brainstorming, obwohl das Brainstorming Guilfords Entdeckung der divergenten Produktion um einige Jahre vorausging; Guilford, 1956; Osborn, 1953). Divergentes Denken kann entweder als bereichsübergreifend oder bereichsspezifisch betrachtet werden, wobei die Auffassung, dass es sich um eine bereichsübergreifende Fähigkeit handelt, weitaus verbreiteter ist. In dem Maße, in dem Kreativität jedoch bereichsspezifisch ist, können bereichsallgemeine Theorien des divergenten Denkens nicht gültig sein und müssen durch bereichsspezifische Versionen ersetzt werden.
Bereichsspezifisches divergentes Denken funktioniert genauso wie bereichsallgemeines divergentes Denken, indem es eine Reihe möglicher Antworten auf eine offene Aufforderung hervorbringt (und Geläufigkeit, Flexibilität, Originalität und Ausarbeitung bleiben Schlüsselkomponenten des divergenten Denkens bei Bereichsspezifität). Der Unterschied besteht einfach darin, dass sich die Fähigkeiten des divergenten Denkens, die die Kreativität in einem Bereich fördern, von den Fähigkeiten des divergenten Denkens unterscheiden, die zu Kreativität in anderen Bereichen führen (z. B., Die Fähigkeit, sich viele verschiedene und ungewöhnliche Wege auszudenken, um die Division durch Brüche zu erklären, kann im Mathematikunterricht zu Kreativität führen, ist aber in anderen Bereichen wie Bildhauerei, Musikkomposition oder Geschichtsunterricht von geringem Wert).
Da divergentes Denken als eine Vielzahl bereichsspezifischer Fähigkeiten und nicht als eine einzige, bereichsübergreifende Fähigkeit konzeptualisiert werden kann, verlangt die Akzeptanz der Bereichsspezifität von den Kreativitätsforschern nicht, dass sie das divergente Denken als einen wichtigen Beitrag zur Kreativität aufgeben. Die Bereichsspezifität besagt, dass die Verwendung von bereichsübergreifenden Tests für divergentes Denken nicht gültig sein kann, aber bereichsspezifische Tests können immer noch entwickelt und verwendet werden, wenn sie für einen bestimmten Zweck benötigt werden, wie es in der Kreativitätsforschung der Fall sein könnte. Die Domänenspezifität ändert auch die Art und Weise, wie man Menschen beibringen muss, kreativer zu sein, aber selbst wenn man solche Fähigkeiten des kreativen Denkens direkt lehrt, wie in Kapitel 6 über Kreativitätstraining gezeigt wird, kann divergentes Denken unter einer domänenspezifischen Interpretation genauso wichtig sein; es muss nur auf eine etwas andere Art und Weise angewendet werden, was die Art der Aufforderungen und Trainingsaktivitäten beeinflusst, die man wählen könnte. Es ist wahrscheinlich wahr, dass eine Form des divergenten Denkens (entweder in seiner allgemeinen bereichsbezogenen Version oder in seiner neueren bereichsspezifischen Konzeptualisierung) wahrscheinlich Teil des kreativen Denkens ist – das ist eine empirische Frage, deren Antwort durch die Verwendung von angeblich (aber tatsächlich nicht) bereichsübergreifenden Trainings und Tests zum divergenten Denken etwas getrübt wurde -, obwohl es nicht mehr wahrscheinlich scheint, dass es der einzige oder primäre Bestandteil ist, wie in der Vergangenheit manchmal angenommen wurde (Amabile, 1996; Kaufman, 2009; Kaufman & Baer, 2005a, 2006; Simonton, 2010a; Sternberg, 1999).
Leider ist es die domänenspezifische Version des divergenten Denkens, die als Grundlage für einige der am häufigsten verwendeten Kreativitätstests dient. Die Domänenspezifität stellt die Verwendung solcher Tests in Frage und stellt die Gültigkeit der Forschungsergebnisse in Frage, die auf diesen Tests beruhen. Bei der Auswahl von Messgrößen, die bei der Durchführung von Untersuchungen zur Bereichsallgemeinheit/-spezifität verwendet werden sollen, stellen Tests für divergentes Denken ein besonderes Problem dar, da die Bereichsallgemeinheit eine eingebaute Annahme der Tests ist. Es gibt zum Beispiel zwei verschiedene Versionen des Torrance-Tests, einen figuralen und einen verbalen, aber beide werden routinemäßig als bereichsübergreifende Tests verwendet.
Jeder der beiden Torrance-Tests gibt verschiedene Teilergebnisse an. Diese Teilergebnisse haben sich im Laufe der Jahre stark verändert, aber zum Beispiel der figurale Test behauptet derzeit, „fünf geistige Eigenschaften“ und 13 „kreative Stärken“ zu bewerten (Scholastic Testing Service, 2013). Es gibt auch einen allgemeinen „Kreativitätsindex“, aber Torrance selbst warnte vor der Interpretation seiner Tests mit nur einer Zahl:
Torrance hat von der Verwendung zusammengesetzter Punktzahlen für den TTCT abgeraten. Er warnte davor, dass die Verwendung eines einzigen Ergebnisses wie eines zusammengesetzten Ergebnisses irreführend sein kann, da jede Teilskala eine unabhängige Bedeutung hat. (Kim et al., 2006, S. 461)
Torrance stellte auch fest, dass seine beiden bereichsspezifischen Tests des divergenten Denkens im Wesentlichen unkorreliert sind:
Die Antworten auf die verbalen und figuralen Formen des TTCT werden nicht nur in zwei verschiedenen Modalitäten ausgedrückt . . . sondern sie sind auch Messgrößen für unterschiedliche kognitive Fähigkeiten. Tatsächlich fand Torrance (1990) eine sehr geringe Korrelation (r = .06) zwischen den Leistungen in den verbalen und figuralen Tests. (Cramond et al., 2005, S. 283-284)
Die Warnungen von Torrance sind jedoch auf taube Ohren gestoßen. Unterskalenwerte, die verschiedene Aspekte des divergenten Denkens messen, werden routinemäßig zugunsten des Gesamtkreativitätsindexes ignoriert, insbesondere von Begabtenförderungsprogrammen, die die aktivsten Nutzer der Torrance-Tests sind (Scholastic Testing Service, 2013), und Forscher argumentieren jetzt oft, dass der Gesamtkreativitätsindex der beste Prädiktor für kreative Fähigkeiten ist (z. B., Plucker, 1999; Yamada & Tam, 1996).
Die Tatsache, dass Torrance zwei verschiedene bereichsspezifische Tests für divergentes Denken entwickelt und festgestellt hat, dass sie im Wesentlichen orthogonal sind und daher zwei sehr unterschiedliche Fähigkeiten messen (Cramond et al., 2005), hat natürlich Probleme für diejenigen verursacht, die beide Tests in derselben Studie verwendet und sie beide als Messwerte für bereichsübergreifende Kreativität interpretiert haben. So wurde beispielsweise in einer kürzlich durchgeführten Studie zur Validierung der Torrance-Tests festgestellt, dass einer der Tests mit wichtigen Ergebnismaßen korrelierte, der andere jedoch nicht. In diesem Fall sagten die Ergebnisse des verbalen divergenten Denkens viele der Dinge voraus, die in der Studie als Nachweis für kreative Leistungen herangezogen wurden (Dinge, die die Probanden selbst als persönliche Leistungen auf einer Checkliste für kreative Leistungen angegeben hatten), die Ergebnisse des figuralen divergenten Denkens jedoch nicht. Wie der Autor erklärte:
Die Bedeutung der verbalen DT im Vergleich zur figuralen DT könnte auf eine sprachliche Verzerrung in den Checklisten für kreative Leistungen von Erwachsenen zurückzuführen sein. Wenn z.B. die Mehrheit der kreativen Leistungen ein hohes Maß an sprachlicher Begabung erfordert, im Gegensatz zu räumlicher Begabung oder Problemlösungstalent, würde man erwarten, dass die verbalen DT-Tests eine signifikant höhere Korrelation zu diesen Leistungstypen aufweisen als andere Formen der DT. (Plucker, 1999, S. 110)
Dieses Ergebnis ist genau das, was die Theorie der Domänenspezifität vorhersagen würde. Unterschiedliche Kreativitätsmaße, die in verschiedenen Domänen verwurzelt sind, sagen kreative Leistungen nur in ihren jeweiligen Domänen voraus. Leider haben diese Art von Ergebnissen (einschließlich derjenigen des Erfinders der Tests) die Vermarkter der Torrance-Tests nicht dazu veranlasst, ihre Behauptungen zurückzunehmen. Sowohl die figurale als auch die verbale Form des Tests behaupten, allgemeine Kreativitätstests zu sein (Scholastic Testing Service, 2013).
Da Divergent-Thinking-Tests wie die Torrance-Tests von einer allgemeinen Domäne ausgehen, können sie kaum in Studien verwendet werden, deren Ziel es ist, zu prüfen, ob Kreativität domänenübergreifend oder domänenspezifisch ist (auch wenn die Ergebnisse der Tests trotz ihrer Behauptung einer allgemeinen Domäne Beweise dafür liefern, dass Kreativität domänenspezifisch ist, wie z. B. die von Torrance selbst vorgelegten Ergebnisse; Cramond et al., 2005). Für diese Art von Forschung wird ein Beurteilungsverfahren benötigt, das keine Aussage über die Allgemeinheit bzw. Spezifität des Bereichs macht.
Glücklicherweise hat das divergente Denken nicht mehr die Art von Monopol, die es einst in der Kreativitätstheorie und -testung genoss, und auch nicht mehr den breiten Respekt, den es einst unter Kreativitätstheoretikern und -forschern hervorrief. Es wurden andere Kreativitätstests entwickelt, und obwohl keiner von ihnen die nahezu universelle Akzeptanz erlangt hat, die die Torrance-Tests (und andere Tests zum divergenten Denken) einst hatten, bieten sie andere Möglichkeiten als Forschungsinstrumente.
Ein kürzlich erschienenes Buch über die Bewertung von Kreativität (Kaufman et al., 2008a) enthält Kapitel über vier Arten von Kreativitätsmessungen: divergentes Denken, Bewertungen durch andere (Lehrer, Gleichaltrige, Eltern), Selbstbewertungen und ein Verfahren namens Consensual Assessment Technique (CAT), bei dem Experten die Kreativität von Dingen beurteilen, die Menschen geschaffen haben (Gedichte, Kunstwerke, Theorien, Puzzles, Aufläufe, Werbung, Darbietungen jeder Art; es kann für so ziemlich alles verwendet werden).
Fremd- und Selbsteinschätzungen erfordern keine Annahme über die Allgemeinheit oder Besonderheit des Bereichs, aber die Art und Weise, wie die Einschätzungen strukturiert sind, kann (und tut es oft) eine solche Annahme hinzufügen. Wenn man nach der Kreativität von X als Architekt fragt, wird weder die Allgemeinheit noch die Besonderheit des Fachgebiets vorausgesetzt. (Wenn Kreativität tatsächlich bereichsübergreifend ist, dann würde die Kreativität von X in der Architektur natürlich für die Kreativität von X im Allgemeinen sprechen. Aber die Frage nach der Kreativität von X in der Architektur lässt nur die Bereichsallgemeinheit zu – sie setzt sie nicht voraus – und sie lässt ebenso zu, dass die Kreativität bereichsspezifisch ist.) Wenn man aber einfach fragt, wie kreativ X ist, dann geht die Frage davon aus, dass die Antwort auf X im Allgemeinen zutrifft. Eine allgemeine Frage „Wie kreativ ist X?“ geht daher von der Allgemeingültigkeit des Bereichs aus und kann einem Forscher nicht dabei helfen, herauszufinden, wie bereichsübergreifend oder bereichsspezifisch Kreativität sein könnte. Leider wurden in den meisten Fällen, in denen Forscher nach der Kreativität anderer gefragt haben, die Fragen so formuliert, dass sie bereichsübergreifende Antworten erfordern und daher wenig hilfreich sind, wenn es darum geht, Streitigkeiten über die Allgemeinheit/Spezifität von Bereichen beizulegen.
Selbsteinschätzungen der Kreativität ähneln den Einschätzungen anderer insofern, als sie nach der Kreativität im Allgemeinen (und damit nach der Allgemeinheit von Bereichen) oder nach der Kreativität in bestimmten Bereichen (und damit ohne Annahmen über die Allgemeinheit/Spezifität) fragen können. Studien dieser Art haben tendenziell ein hohes Maß an Bereichsspezifität gezeigt (wie in Kapitel 2 erörtert), aber diese Technik hat zwei große Schwächen:
Selbsteinschätzungen im Allgemeinen und Selbsteinschätzungen der Kreativität im Besonderen haben tendenziell eine begrenzte Gültigkeit. (Manche könnten sogar behaupten, dass sie überhaupt keine Gültigkeit haben, aber so oder so – mit entweder sehr begrenzter oder gar keiner Gültigkeit – sind sie deutlich weniger als ideale Forschungsinstrumente).
Obwohl Menschen, die gebeten werden, ihre eigene Kreativität in verschiedenen Bereichen zu beurteilen, dazu neigen, sich selbst in verschiedenen Bereichen unterschiedlich zu bewerten, könnte man argumentieren, dass solche Fragen, obwohl sie eigentlich keine Bereichsspezifität voraussetzen, die Antworten in diese Richtung drängen. Denn wenn Kreativität bereichsübergreifend wäre, warum sollte man dann nach der Kreativität in vielen verschiedenen Bereichen fragen? Für die Befragten könnte es den Anschein haben, dass die Fragesteller tatsächlich von einer Bereichsspezifität ausgehen.
Selbst- und Fremdeinschätzungen haben sich also als nicht besonders nützlich erwiesen, wenn es darum geht, Fragen zur Bereichsgeneralität/-spezifität zu beantworten. Divergent-Thinking-Tests gehen in der Regel von der Allgemeinheit des Bereichs aus; obwohl sie dies nicht tun müssen, gehen alle gängigen Divergent-Thinking-Tests – auch solche wie der von Torrance, die die bereichsbezogenen Bezeichnungen figural und verbal tragen – von dieser Annahme aus und fördern die bereichsübergreifende Interpretation. Divergent-Thinking-Tests stehen auch vor dem Problem, dass die Beweise für die Gültigkeit von Divergent-Thinking-Tests als Maß für Kreativität bestenfalls schwach sind. Wie bereits erwähnt, ging es in der ersten von der Abteilung 10 (Psychologie der Ästhetik, Kreativität und Künste) der American Psychological Association gesponserten Debatte um die Gültigkeit von Tests für divergentes Denken wie den Torrance-Tests (Baer, 2009; Kim, 2009), was darauf hindeutet, dass dies eine offene Frage ist. (Der Titel der Debatte lautete „Sind die Torrance-Tests für kreatives Denken im 21. Jahrhundert noch relevant?) Jahrhundert noch relevant?“) Selbst wenn man also einen Weg finden könnte, mit Hilfe von Tests für divergentes Denken die Allgemeinheit bzw. Spezifität von Kreativität zu messen (z. B. indem man Probanden Tests für divergentes Denken in verschiedenen Bereichen durchführt und die Ergebnisse vergleicht, wie es Torrance selbst getan hat, mit Ergebnissen, die eindeutig auf Domänenspezifität hinweisen; Cramond et al, 2005), würden Fragen zur Gültigkeit von Tests zum divergenten Denken (sogar bereichsspezifische Tests zum divergenten Denken) das Vertrauen in die erzielten Ergebnisse untergraben.
Bleibt die andere primäre Methode zur Kreativitätsbewertung, der CAT (Amabile, 1982, 1983, 1996198219831996). Der CAT bewertet Kreativität auf allen Ebenen (ob es sich nun um die ganz normale „Little-C“-Kreativität handelt, die schon Kinder zeigen, oder um die paradigmenverändernde „Big-C“-Kreativität der originellsten und einflussreichsten Denker auf ihrem Gebiet) auf dieselbe Art und Weise, wie Kreativität in der realen Welt am häufigsten bewertet wird – durch die Meinung von Experten auf dem entsprechenden Gebiet. So wie die Nobelpreisträger von Expertengremien ausgewählt werden, die die Kreativität der Beiträge zu ihrem jeweiligen Fachgebiet beurteilen, setzt der CAT Experten eines Fachgebiets ein, um die Kreativität tatsächlicher Produkte in diesem Fachgebiet zu beurteilen. Die Beurteilungen der Experten können sich natürlich im Laufe der Zeit ändern; die Standards in jedem Bereich, ob künstlerisch, wissenschaftlich oder praktisch, sind nicht unveränderlich, und was in einer Epoche als kreativ angesehen wurde, kann in einer anderen als weniger kreativ gelten (und umgekehrt), ebenso wie die Qualifikationen der Experten in jedem Bereich. Aber die bestmögliche Einschätzung der Kreativität eines Produkts zu einem bestimmten Zeitpunkt ist die kollektive Einschätzung der anerkannten Experten auf diesem Gebiet. Es gibt einfach keinen besseren Maßstab (Baer & McKool, 2009, 201420092014).
Die Experten, die bei einer CAT-Bewertung die Kreativität bewerten, geben ihre Urteile unabhängig voneinander ab – es gibt keine Möglichkeit für sie, die Meinung der anderen zu beeinflussen – was eine Überprüfung der Inter-Rater-Reliabilität ermöglicht, die im Allgemeinen recht gut ist. Je nach den zu beurteilenden Artefakten werden natürlich unterschiedliche Experten benötigt. Dichter, Poesiekritiker und Poesielehrer könnten als Richter dienen, wenn es sich bei den Artefakten um Haiku-Gedichte handelt, während Künstler, Kunstkritiker und Kunstlehrer geeignet wären, wenn es sich bei den Artefakten um Collagen handelt. Jeder Experte wird gebeten, die Kreativität jedes einzelnen Produkts in der Studie im Verhältnis zu allen anderen in der Stichprobe und nicht im Vergleich zu einem externen Standard zu beurteilen. Alle Beurteilungen sind relativ zur Kreativität der anderen Artefakte in der zu beurteilenden Gruppe. Es wird eine Likert-Skala verwendet, so dass die Bewertungen über einen Bereich möglicher Bewertungen verteilt sind, und die Juroren werden ermutigt, die gesamte Skala zu verwenden, wobei die kreativsten Artefakte in der Gruppe mit der höchsten Punktzahl und die am wenigsten kreativen mit der niedrigsten Punktzahl bewertet werden, mit dem Ziel, die vergleichbare Kreativität unter den Artefakten in der Gruppe zu unterscheiden. Der Mittelwert der Bewertungen aller Jurymitglieder (die in einer typischen Studie aus 10 bis 15 Personen bestehen können) wird als Kreativitätswert für jedes Artefakt verwendet (Amabile, 1996; Baer, Kaufman, & Gentile, 2004; Kaufman et al., 2008a).
Das Verfahren ist sowohl einfach als auch geradlinig, obwohl einfach leider nicht gleichbedeutend mit einfach oder kostengünstig ist. Im Gegensatz zu den Studenten, aus denen sich ein Großteil der psychologischen Forschung zusammensetzt, sind Experten nicht so frei verfügbar. Je nach Art der zu beurteilenden Artefakte werden verschiedene Arten von Experten benötigt, die in der Regel für ihre Arbeit bezahlt werden. Einige Studien haben gezeigt, dass Quasi-Experten in einigen Bereichen (z. B. Studenten in einem Fachgebiet, die noch nicht als Experten gelten) Bewertungen abgeben, die denen von Experten recht ähnlich sind, was die Kosten etwas senken kann. Die Verwendung von unerfahrenen Bewertern (z. B. Studenten) führt jedoch selten zu denselben Bewertungen wie Experten, so dass die CAT im Allgemeinen Richter mit zumindest einem bescheidenen Maß an Fachwissen auf dem betreffenden Gebiet erfordert und daher teurer ist als viele andere Methoden der Kreativitätsbewertung (Kaufman, Baer, & Cole, 2009b; Kaufman, Baer, Cole, & Sexton, 2008b; Kaufman, Baer, Cropley, Reiter-Palmon, & Sinnett, 2013a).
Der CAT ist etwas ressourcenintensiv, aber er hat viele Vorteile und wurde als „Goldstandard“ der Kreativitätsbewertung bezeichnet (Carson, 2006). Die Langzeitstabilität einzelner CAT-Bewertungen ist ebenso gut wie die Langzeitstabilität der Ergebnisse etablierter Mehritem-Divergenztests (z. B. liegen in beiden Fällen die Test-Retest-Korrelationen nach einem Jahr bei Probanden im Grundschulalter im Bereich von 0,50), und wenn mehrere kreative Produkte desselben Typs erstellt und sowohl in der Vor- als auch in der Nachtestphase bewertet werden, zeigt die CAT-Langzeitstabilität sogar noch bessere Ergebnisse (Baer, 1994c; Kogan, 1983). Der CAT kann zur Beurteilung der Kreativität von Artefakten in fast jedem Bereich eingesetzt werden. Im Gegensatz zu divergentem Denken und anderen Tests von Teilfähigkeiten, die theoretisch mit Kreativität in Verbindung gebracht werden, bewertet der CAT die tatsächliche kreative Leistung und ist daher nicht von der Akzeptanz oder Gültigkeit einer bestimmten Kreativitätstheorie abhängig. Der CAT vermeidet auch Halo-Effekte und andere persönliche Voreingenommenheiten, die die Beurteilung der Kreativität durch andere oder durch einen selbst beeinträchtigen könnten. Obwohl es bei der Beurteilung um die Kreativität von Artefakten in einem bestimmten Bereich geht, werden bei der Anwendung des CAT keine Annahmen über die Spezifität oder Allgemeinheit von Kreativität getroffen. Der CAT ist mit keiner Theorie über das Wesen der Kreativität verbunden und ist völlig neutral in Bezug auf Fragen der Bereichsspezifität und -allgemeinheit, was ihn zu einem idealen Maß für Kreativität in diesem Bereich macht.
In Kapitel 2 wird die Forschung über die Bereichsspezifität und -allgemeinheit von Kreativität im Detail untersucht, wobei ein großer Teil davon den CAT verwendet. Die Ergebnisse zeigen ziemlich einheitlich, dass die Allgemeingültigkeit für bestimmte Bereiche gering ist. Eine wichtige Forschungsmethode besteht darin, den Probanden eine Reihe verschiedener Aufgaben in unterschiedlichen Bereichen zu stellen (z. B. eine Collage erstellen, ein Gedicht schreiben, eine Geschichte verfassen), diese Produkte von Expertengremien in den jeweiligen Bereichen unabhängig voneinander mit dem CAT auf ihre Kreativität hin bewerten zu lassen und dann nach Korrelationen zwischen den Bewertungen in den verschiedenen Bereichen zu suchen. Die beiden konkurrierenden Theorien – Bereichsallgemeinheit und Bereichsspezifität – machen unterschiedliche Vorhersagen über die tatsächliche kreative Leistung. Ein Kreativitätsforscher fasste die Unterschiede zwischen diesen Vorhersagen wie folgt zusammen:
Die Bereichsgeneralität wird durch hohe Interkorrelationen zwischen verschiedenen kreativen Verhaltensweisen unterstützt … während die Bereichsspezifität durch relativ geringe Korrelationen zwischen verschiedenen Verhaltensweisen unterstützt wird. (Ivcevic, 2007, S. 272)
Die Korrelationen, die in den vielen Studien, die genau diesen Vergleich angestellt haben, berichtet wurden, tendieren gegen Null (insbesondere wenn die der Intelligenz zuzuschreibende Varianz entfernt wird; Kapitel 2 bespricht diese Forschung im Detail, aber siehe Baer, 2010, 201320102013 für Zusammenfassungen), und selbst Autoren, die behauptet haben, ein gewisses Maß an Domänengeneralität gefunden zu haben, finden es typischerweise nur innerhalb von Domänen. So berichteten Conti, Coon und Amabile (1996) über Korrelationen von Kreativitätsbewertungen bei verschiedenen Aufgaben zum Schreiben von Kurzgeschichten, die zwischen 0,43 und 0,87 lagen, sowie über einige kleinere, aber immer noch statistisch signifikante Korrelationen zwischen verschiedenen Kunstaufgaben (die Kunstaufgaben waren einander weniger ähnlich als die Schreibaufgaben, so dass dieses Ergebnis zu erwarten war). Diese Ergebnisse sind jedoch alle bereichsinterne Korrelationen und zeigen daher nur, dass innerhalb eines Bereichs (z. B. Schreiben von Kurzgeschichten oder Kunst) eine gewisse Allgemeingültigkeit besteht, wie sowohl die Bereichsspezifität als auch die Bereichsallgemeinheit vorhersagen. Im Gegensatz zu den vielen statistisch signifikanten bereichsinternen Korrelationen waren die 13 berichteten bereichsübergreifenden (Schreiben-Kunst) Korrelationen – die für die Bereichsspezifität von Bedeutung sind – allesamt winzig und, ob positiv oder negativ, keine war statistisch signifikant. Trotz der Behauptung dieser Autoren, dass sie Beweise für die Bereichsgeneralität gefunden haben, war alles, was sie gefunden haben, die Bereichsgeneralität (d.h. die Bereichsspezifität).
Feist (2004) kommentierte, dass es eine „verlockende und letztlich fest amerikanische Vorstellung ist, dass ein kreativer Mensch in jedem Bereich seiner Wahl kreativ sein kann. Die Person müsse sich nur entscheiden, wo sie ihre Talente und Bemühungen einsetzen wolle, viel üben oder trainieren, und voilà, schon habe man eine kreative Leistung. In dieser Sichtweise übertrumpft das Talent den Bereich, und es ist wirklich etwas willkürlich, in welchem Bereich die kreative Leistung zum Ausdruck kommt.“ Auch wenn dies verlockend ist, kommt Feist zu dem Schluss, dass „dies eine ziemlich naive und letztlich falsche Position ist und dass kreatives Talent in der Tat bereichsspezifisch ist … Kreativität und Talent gehören in der Regel nicht zu den bereichsübergreifenden Fähigkeiten“ (S. 57).2
Nachdem in Kapitel 2 die Beweise für und gegen die Bereichsspezifität dargelegt wurden, wird in den Kapiteln 3-63456 untersucht, was diese Forschungsergebnisse für die Kreativitätstheorie, die Kreativitätsforschung, die Kreativitätstests und das Kreativitätstraining bedeuten, gefolgt von einem Blick darauf, welche Arten von Kreativitätstheorien im Rahmen der Bereichsspezifität realisierbar wären. Obwohl die Leser eingeladen sind, jedes dieser Kapitel der Reihe nach zu lesen, wurden sie in dem Bewusstsein verfasst, dass viele Leser nur an einem oder einigen wenigen Kapiteln ein besonderes Interesse haben werden. Das Überspringen von Kapiteln sollte nicht zu großer Verwirrung führen (obwohl die Abfassung der Kapitel in einer Weise, die dies ermöglicht, die gelegentliche Wiederholung einiger Schlüsselideen und Forschungsergebnisse erfordert hat). Leser, die bereits mit den Forschungsergebnissen, die die Domänenspezifität unterstützen, vertraut (und davon überzeugt) sind, können beispielsweise die umfassende Übersicht über diese Ergebnisse in Kapitel 2 überspringen, in dem einige der in diesem Kapitel kurz dargestellten Ergebnisse ausführlicher behandelt werden.