How is Creativity Measured?
Badania nad kreatywnością były utrudnione przez brak dobrych miar kreatywności. Rozdział 5 zawiera dyskusję dotyczącą badań nad specyficznymi dla danej dziedziny środkami testowania kreatywności. To, co muszę teraz wyjaśnić, jest (w pewnym sensie) przeciwieństwem: co testy kreatywności oznaczają dla badań nad specyficznością dziedzinową.
Niestety, sposoby, w jakie kreatywność była najczęściej testowana i założenia wielu testów kreatywności sprawiają, że testy te nie nadają się do użycia w określaniu, czy kreatywność jest specyficzna dla danej dziedziny czy ogólna. Nawet gdyby najpowszechniej stosowane testy były ważne, co w większości przypadków nie ma miejsca, to i tak nie byłyby one przydatne do rozstrzygania kwestii dotyczących ogólności i specyficzności dziedziny, ponieważ są to po prostu niewłaściwe rodzaje testów. Sytuacja przypomina raczej bycie zmuszonym do użycia testu ortograficznego, by określić, czy zdolności muzyczne, matematyczne, artystyczne, sportowe i werbalne są powiązane. Te pięć rodzajów zdolności może, ale nie musi, być ze sobą powiązane i istnieją projekty badawcze, które mogą pomóc wysondować, jakie, jeśli w ogóle, mogą być te związki. Ale nawet dobrze poparte, ważny test ortografii, używane przez siebie, byłoby mało przydatne w odpowiedzi na pytania dotyczące możliwych połączeń między tymi różnymi rodzajami zdolności.
Sytuacja jest trudna, ale nie jest beznadziejna. Tak jak można użyć wyników w oddzielnych testach zdolności muzycznych, matematycznych, artystycznych, sportowych i werbalnych, by zbadać, jakie mogą być wzajemne powiązania między tymi zdolnościami, istnieją sposoby oceny kreatywności w różnych domenach, które mogą być użyte do odpowiedzi na pytania o ogólność/specyficzność domeny. Jednak rodzaje potrzebnych testów nie są niedrogimi, łatwymi do przeprowadzenia i obiektywnie skalowalnymi testami ogólnymi, które przez długi czas dominowały w ocenie kreatywności.
Testy myślenia dywergencyjnego były przez wiele lat najczęściej stosowaną miarą kreatywności. W przeglądzie wszystkich opublikowanych badań nad kreatywnością z 1984 roku, Testy Torrance’a, które nie są jedynymi testami myślenia dywergencyjnego w użyciu, ale z pewnością najczęściej stosowanymi, stanowiły trzy czwarte wszystkich badań nad kreatywnością z udziałem studentów i 40% mniejszego podzbioru wszystkich badań nad kreatywnością z udziałem dorosłych jako uczestników (Torrance & Presbury, 1984). Testy Torrance’a i inne testy myślenia dywergencyjnego opierają się na modelu Struktury Intelektu Guilforda (1956), w którym dowodził on, że „produkcja dywergencyjna” – myślenie o szerokiej gamie pomysłów w odpowiedzi na otwarte pytanie lub podpowiedź – w znacznym stopniu przyczynia się do kreatywności. Definiując produkcję dywergencyjną (która oznacza to samo, co myślenie dywergencyjne, termin, którego używał również Guilford; myślenie dywergencyjne jest terminem częściej używanym obecnie), Guilford wyraźnie rozróżniał myślenie dywergencyjne i konwergencyjne:
W testach myślenia konwergencyjnego, osoba egzaminowana musi dojść do jednej właściwej odpowiedzi. Podane informacje są zazwyczaj wystarczająco uporządkowane, aby istniała tylko jedna właściwa odpowiedź. Przykładem z materiałem werbalnym może być: „Co jest przeciwieństwem twardego?”. W myśleniu dywergencyjnym myśliciel musi dokonać wielu poszukiwań i często wiele odpowiedzi wystarczy lub jest pożądanych. Jeśli poprosisz egzaminowanego, aby wymienił wszystkie rzeczy, które przychodzą mu do głowy, a które są twarde, jadalne i białe, to ma on całą klasę rzeczy, które może zrobić. To właśnie w kategorii myślenia dywergencyjnego znajdujemy zdolności, które są najbardziej znaczące w kreatywnym myśleniu i wynalazczości. (Guilford, 1968, s. 8)
Torrance, którego tytułowe Torrance’owskie Testy Twórczego Myślenia są w rzeczywistości testami myślenia dywergencyjnego (testy te zostaną szczegółowo omówione później), poczynił podobne spostrzeżenie:
Uczenie się przez autorytet wydaje się przede wszystkim obejmować takie zdolności jak rozpoznawanie, pamięć i logiczne rozumowanie – które są, nawiasem mówiąc, zdolnościami najczęściej ocenianymi przez tradycyjne testy inteligencji i miary uzdolnień szkolnych. W przeciwieństwie do tego, uczenie się w sposób kreatywny, poprzez działania twórcze i rozwiązywanie problemów, oprócz rozpoznawania, zapamiętywania i logicznego rozumowania, wymaga . . oceny, …, rozbieżnej produkcji, … i redefinicji. (Torrance, 1970, s. 2)
Cztery aspekty myślenia dywergencyjnego są często wymieniane w literaturze:
–
Płynność to całkowita liczba reakcji na dany bodziec, „całkowita liczba pomysłów podawanych podczas jednego ćwiczenia myślenia dywergencyjnego.” (Runco, 1999a, s. 577)
–
Oryginalność to odrębność odpowiedzi na dany bodziec, „niezwykłość … pomysłów egzaminowanego lub respondenta”. (Runco, 1999a, s. 577)
–
Lastyczność to liczba różnych kategorii lub rodzajów odpowiedzi na dane bodźce, lub szerzej, „zmiana w znaczeniu, użyciu lub interpretacji czegoś.” (Guilford, 1968, s. 99)
–
Praca jest rozszerzeniem lub poszerzeniem pomysłów w odpowiedziach na dane bodźce, „bogactwo szczegółów w pomysłach, które ktoś produkuje.” (Baer, 1997a, s. 22)
Niedawno wydana książka na temat oceny kreatywności zilustrowała to następującym scenariuszem:
Gdyby osoba planowała spotkanie towarzyskie w restauracji z okazji specjalnej okazji, może chcieć stworzyć listę możliwych lokalizacji. Może stworzyć listę 50 potencjalnych restauracji (wysoka płynność), listę zawierającą restauracje, o których jej przyjaciele raczej by nie pomyśleli (wysoka oryginalność), listę zawierającą szeroki zakres typów restauracji (wysoka elastyczność) lub listę zawierającą tylko restauracje indyjskie, ale wymieniającą każdy możliwy lokal tego typu w okolicy (wysoki poziom opracowania). (Kaufman, Plucker, & Baer, 2008a, s. 18)
Większość wczesnych testów kreatywności była zasadniczo testami myślenia dywergencyjnego, które przez wiele lat miały bardzo małą konkurencję, z wyjątkiem siebie nawzajem. Ich starszeństwo jest prawdopodobnie jednym z powodów, dla których testy te były tak szeroko stosowane, ale miały one również inne zalety. Stanowiły wygodną paralelę do testów IQ opartych na jednej liczbie (mimo że ich zwolennicy, w tym sam Torrance, często argumentowali przeciwko takiej konceptualizacji; Kim, Cramond, & Bandalos, 2006); testy są proste w użyciu, nawet dla małych dzieci; a idea myślenia dywergencyjnego, na której się opierają, jest łatwa do zrozumienia i ma silne intuicyjne odwołanie (Baer, 1993; Kaufman et al…, 2008a; Kim, 2008; Runco, 1999a; Torrance, 1993; Torrance & Presbury, 1984; Wallach & Wing, 1969).
Myślenie dywergencyjne, konceptualizowane jako jeden z komponentów myślenia twórczego, pozostaje ważną koncepcją wśród badaczy twórczości i jest podstawą niektórych z najbardziej powszechnych działań trenujących twórczość (takich jak burza mózgów, mimo że burza mózgów poprzedziła odkrycie Guilforda o kilka lat; Guilford, 1956; Osborn, 1953). Myślenie dywergencyjne może być postrzegane zarówno jako umiejętność ogólna, jak i specyficzna dla danej dziedziny, ale znacznie powszechniejsze jest pojmowanie go jako umiejętności ogólnej. Jednak w zakresie, w jakim kreatywność jest specyficzna dla danej dziedziny, ogólne teorie myślenia dywergencyjnego nie mogą być ważne i muszą być zastąpione przez wersje specyficzne dla tej dziedziny.
Rozbieżne myślenie specyficzne dla danej dziedziny działa dokładnie tak samo, jak ogólne myślenie dywergencyjne w tworzeniu zakresu możliwych odpowiedzi na otwartą podpowiedź (a płynność, elastyczność, oryginalność i rozwinięcie pozostają kluczowymi składnikami myślenia dywergencyjnego przy specyficzności dziedziny). Różnica polega po prostu na tym, że umiejętności myślenia dywergencyjnego, które wspierają kreatywność w jednej dziedzinie, różnią się od umiejętności myślenia dywergencyjnego, które prowadzą do kreatywności w innych dziedzinach (np, zdolność do myślenia o wielu różnych i niezwykłych sposobach wyjaśniania dzielenia przez ułamki może prowadzić do kreatywności w nauczaniu matematyki, ale ma niewielką wartość w innych dziedzinach, takich jak rzeźbiarstwo, komponowanie muzyki czy nauczanie historii).
Ponieważ myślenie dywergencyjne może być konceptualizowane jako szeroka gama umiejętności specyficznych dla danej dziedziny, a nie pojedyncza, ogólna umiejętność, akceptacja specyficzności dziedzinowej nie wymaga od badaczy twórczości porzucenia myślenia dywergencyjnego jako ważnego czynnika przyczyniającego się do twórczości. Specyficzność domeny przemawia za tym, że stosowanie ogólnych testów myślenia dywergencyjnego nie może być uzasadnione, ale testy specyficzne dla danej dziedziny mogą być nadal opracowywane i stosowane, jeśli są potrzebne do jakiegoś specjalnego celu, tak jak w przypadku badań nad kreatywnością. Specyfika dziedzinowa zmienia również sposób, w jaki należy uczyć ludzi, by byli bardziej kreatywni, ale nawet przy bezpośrednim uczeniu takich umiejętności twórczego myślenia, jak to zostanie pokazane w rozdziale 6 poświęconym treningowi kreatywności, myślenie rozbieżne może być równie ważne przy interpretacji specyficznej dla danej dziedziny; trzeba je tylko stosować w nieco inny sposób, co wpłynie na rodzaj podpowiedzi i działań szkoleniowych, jakie można wybrać. Prawdopodobnie prawdą jest, że jakaś forma myślenia dywergencyjnego (zarówno w jego ogólnej wersji domenowej, jak i nowszej konceptualizacji domenowej) jest prawdopodobnie częścią twórczego myślenia – jest to pytanie empiryczne, na które odpowiedź została nieco zaciemniona przez użycie rzekomo (ale w rzeczywistości nie w pełni) ogólnych domenowo szkoleń i testów myślenia dywergencyjnego – chociaż nie wydaje się już prawdopodobne, że jest to jedyny lub podstawowy składnik, jak czasami zakładano w przeszłości (Amabile, 1996; Kaufman, 2009; Kaufman & Baer, 2005a, 2006; Simonton, 2010a; Sternberg, 1999).
Niestety, to właśnie domenowo ogólna wersja myślenia dywergencyjnego służy za podstawę niektórych z najczęściej stosowanych testów kreatywności. Specyficzność dziedzinowa stawia pod znakiem zapytania stosowanie takich testów i podważa wiarygodność wyników badań, które zostały na nich oparte. W doborze miar do badań nad ogólnością/specyficznością dziedziny, testy myślenia dywergencyjnego stanowią szczególny problem, ponieważ ogólność dziedziny jest wbudowanym założeniem tych testów. Istnieją, na przykład, dwie różne wersje Testów Torrance’a, jedna figuralna, druga werbalna, ale obie są rutynowo używane jako testy ogólnodomenowe.
Każdy z dwóch Testów Torrance’a podaje różne wyniki cząstkowe. Na przestrzeni lat nastąpiło wiele zmian w tych podskalach, ale jako przykład, test figuralny obecnie twierdzi, że „ocenia pięć cech umysłowych” i 13 „mocnych stron twórczych” (Scholastic Testing Service, 2013). Istnieje również ogólny „indeks kreatywności”, ale sam Torrance przestrzegał przed interpretacją swoich testów za pomocą pojedynczych liczb:
Torrance zniechęcał do używania złożonych wyników dla TTCT. Ostrzegał, że użycie pojedynczego wyniku, takiego jak wynik złożony, może być mylące, ponieważ każdy wynik w podskali ma niezależne znaczenie. (Kim et al., 2006, s. 461)
Torrance stwierdził również, że jego dwa specyficzne dla dziedziny testy myślenia dywergencyjnego były zasadniczo nieskorelowane:
Reakcje na werbalną i figuralną formę TTCT są nie tylko wyrażone w dwóch różnych modalnościach … ale są również miarą różnych zdolności poznawczych. W rzeczywistości Torrance (1990) znalazł bardzo małą korelację (r = .06) pomiędzy wynikami w teście werbalnym i figuralnym. (Cramond i in., 2005, s. 283-284)
Ostrzeżenia Torrance’a nie zostały jednak wysłuchane. Wyniki w podskalach, które mierzą różne aspekty myślenia dywergencyjnego, są rutynowo ignorowane na rzecz ogólnych wyników Indeksu Kreatywności, zwłaszcza przez programy dla uzdolnionych/zdolnych, które są najbardziej aktywnymi użytkownikami Testów Torrance’a (Scholastic Testing Service, 2013), a badacze obecnie często twierdzą, że ogólny Indeks Kreatywności jest najlepszym predyktorem zdolności twórczych (np, Plucker, 1999; Yamada & Tam, 1996).
Fakt, że Torrance stworzył dwa różne testy myślenia dywergencyjnego specyficzne dla danej dziedziny i stwierdził, że są one zasadniczo ortogonalne, a zatem mierzą dwie bardzo różne zdolności (Cramond i in., 2005), w naturalny sposób spowodował problemy dla tych, którzy wykorzystali oba testy w tym samym badaniu i zinterpretowali je oba jako miary kreatywności ogólnej dla danej dziedziny. Na przykład, w niedawnym badaniu przeprowadzonym w celu walidacji Testów Torrance’a stwierdzono, że jeden z testów korelował z kluczowymi miarami wyników, a drugi nie. W tym przypadku wyniki werbalnego myślenia dywergencyjnego przewidywały wiele rodzajów rzeczy, które w badaniu były wykorzystywane jako dowody kreatywności (rzeczy, które badani podawali jako osobiste osiągnięcia z listy kontrolnej osiągnięć twórczych), ale wyniki figuralnego myślenia dywergencyjnego nie. Jak wyjaśnił autor:
Ważność werbalnego DT w stosunku do figuralnego DT może być spowodowana językowym uprzedzeniem w listach kontrolnych osiągnięć twórczych dorosłych. Na przykład, jeśli większość osiągnięć twórczych wymagała wysokiego stopnia talentu językowego, w przeciwieństwie do talentu przestrzennego lub talentu do rozwiązywania problemów, należałoby oczekiwać, że testy werbalnego DT będą miały znacząco wyższą korelację z tymi typami osiągnięć niż inne formy DT. (Plucker, 1999, s. 110)
Taki wynik jest dokładnie tym, co przewidywałaby teoria specyficzności domeny. Różne miary kreatywności zakorzenione w różnych domenach będą przewidywać kreatywne działanie tylko w ich odpowiednich domenach. Niestety, tego rodzaju ustalenia (w tym ustalenia twórcy testów) nie spowodowały, że ci, którzy wprowadzili Testy Torrance’a na rynek, wycofali się ze swoich twierdzeń. Zarówno figuralna, jak i werbalna forma testu twierdzą, że są ogólnymi testami kreatywności (Scholastic Testing Service, 2013).
Ponieważ testy myślenia dywergencyjnego, takie jak Testy Torrance’a, zakładają ogólność dziedzinową, nie mogą być stosowane w badaniach, których celem jest sprawdzenie, czy kreatywność jest ogólna czy specyficzna dla danej dziedziny (nawet jeśli wyniki testów, pomimo ich twierdzeń o ogólności dziedzinowej, dostarczają dowodów, takich jak te oferowane przez samego Torrance’a, że kreatywność jest specyficzna dla danej dziedziny; Cramond i in., 2005). Do tego rodzaju badań potrzebna jest technika oceny, która nie ma nic wspólnego z ogólnością/specyficznością dziedziny.
Na szczęście myślenie dywergencyjne nie ma już ani monopolu, którym kiedyś cieszyło się w teorii i testach kreatywności, ani szerokiego szacunku, jaki kiedyś wzbudzało wśród teoretyków i badaczy kreatywności. Inne testy kreatywności zostały opracowane i choć żaden z nich nie zyskał niemal powszechnej akceptacji, jaką kiedyś cieszyły się Testy Torrance’a (i inne testy myślenia dywergencyjnego), dają one inne możliwości jako narzędzia badawcze.
Niedawno wydana książka o ocenie kreatywności (Kaufman i in., 2008a) zawierała rozdziały poświęcone czterem rodzajom miar kreatywności: myślenie dywergencyjne, oceny dokonywane przez innych (nauczycieli, rówieśników, rodziców), samoocena i procedura zwana Techniką Oceny Konsensualnej (CAT), która wykorzystuje ekspertów do oceny kreatywności rzeczy stworzonych przez ludzi (wierszy, dzieł sztuki, teorii, zagadek, sufletów, reklam, przedstawień dowolnego rodzaju; może być używana do wszystkiego).
Oceny dokonywane przez innych i samooceny nie wymagają założenia o ogólności lub specyficzności dziedziny, ale sposób w jaki oceny są skonstruowane może (i często to robi) dodać takie założenie. Jeśli pytamy o kreatywność X jako architekta, nie zakładamy ani ogólności ani specyficzności dziedziny. (Jeśli kreatywność jest w rzeczywistości dziedziną ogólną, to kreatywność X w architekturze oczywiście przemawiałaby za kreatywnością X w ogóle. Ale pytanie o kreatywność X w architekturze pozwala jedynie na ogólność dziedziny – nie zakłada jej – i w równym stopniu pozwala na to, by kreatywność była specyficzna dla danej dziedziny). Jeśli jednak pytamy po prostu o to, jak kreatywny jest X, to pytanie zakłada, że odpowiedź będzie dotyczyć X w sposób bardziej ogólny. Ogólne pytanie „Jak bardzo twórczy jest X?” zakłada zatem ogólność dziedziny i jako takie nie może pomóc badaczowi próbującemu określić, jak bardzo twórczość może być ogólna lub specyficzna dla danej dziedziny. Niestety, w większości przypadków, w których badacze pytali o kreatywność innych, pytania te były sformułowane w sposób, który wymagał odpowiedzi ogólnych dla danej dziedziny i jako takie są mało użyteczne w rozstrzyganiu sporów na temat ogólności/specyficzności dziedziny.
Samoocena kreatywności jest podobna do oceny dokonywanej przez innych, ponieważ może pytać o kreatywność w ogóle (tym samym zakładając ogólność dziedziny) lub o kreatywność w konkretnych dziedzinach (co nie zakłada ogólności/specyficzności). Badania tego typu wykazują zwykle dużą specyficzność domeny (co omówiono w Rozdziale 2), ale technika ta ma dwie wielkie słabości:
Oceny własne w ogóle, a samooceny kreatywności w szczególności, mają tendencję do ograniczonej ważności. (Niektórzy mogą nawet posunąć się dalej, twierdząc, że nie mają one żadnej ważności, ale tak czy inaczej – albo z bardzo ograniczoną ważnością, albo bez ważności w ogóle – są znacznie mniej niż idealnymi narzędziami badawczymi).
Pomimo, że poproszeni o ocenę własnej kreatywności w różnych dziedzinach, ludzie mają tendencję do oceniania siebie inaczej w różnych dziedzinach, można by argumentować, że chociaż takie pytania nie zakładają w rzeczywistości specyficzności dziedziny, mogą mieć tendencję do popychania odpowiedzi w tym kierunku. W końcu, gdyby kreatywność była dziedziną ogólną, dlaczego pytano by o kreatywność w wielu różnych dziedzinach? Respondentom może się wydawać, że osoby zadające te pytania w rzeczywistości zakładają specyficzność dziedziny.
Oceny własne i oceny innych osób nie są szczególnie przydatne w udzielaniu odpowiedzi na pytania o ogólność/specyficzność dziedziny. Testy myślenia dywergencyjnego zazwyczaj zakładają ogólność dziedziny; w rzeczywistości, mimo że nie muszą tego robić, wszystkie powszechnie stosowane testy myślenia dywergencyjnego – nawet takie jak Torrance’a, które noszą domenowe etykiety figuralne i werbalne – przyjmują to założenie i zachęcają do interpretacji ogólnej. Testy myślenia dywergencyjnego borykają się również z problemem tego, że dowody na zasadność stosowania testów myślenia dywergencyjnego jako miar kreatywności są, w najlepszym razie, dość słabe. Jak już wspomniano, pierwsza debata sponsorowana przez American Psychological Association’s Division 10 (Psychology of Aesthetics, Creativity and the Arts) dotyczyła ważności testów myślenia dywergencyjnego, takich jak Testy Torrance’a (Baer, 2009; Kim, 2009), co sugeruje, że jest to kwestia otwarta. (Tytuł debaty brzmiał „Czy testy Torrance’a dotyczące kreatywnego myślenia są nadal aktualne w XXI wieku?”). Tak więc nawet jeśli udałoby się znaleźć sposób na wykorzystanie testów myślenia dywergencyjnego do pomiaru ogólności/specyficzności dziedzinowej kreatywności (np. poprzez poddanie badanych testom myślenia dywergencyjnego w różnych dziedzinach i porównanie wyników, co zrobił sam Torrance, uzyskując wyniki, które wyraźnie wskazywały na specyficzność dziedzinową; Cramond i in, 2005), pytania dotyczące ważności testów myślenia dywergencyjnego (nawet testów myślenia dywergencyjnego specyficznych dla danej dziedziny) podważyłyby zaufanie do uzyskanych wyników.
Pozostaje więc druga podstawowa metoda oceny kreatywności, CAT (Amabile, 1982, 1983, 1996198219831996). CAT ocenia kreatywność na wszystkich poziomach (czy to ogrodową kreatywność typu little-c, którą wykazują nawet dzieci, czy też zmieniającą paradygmat kreatywność Big-C najbardziej oryginalnych i wpływowych myślicieli w swoich dziedzinach) w ten sam sposób, w jaki kreatywność jest najczęściej oceniana w świecie rzeczywistym – poprzez opinie ekspertów w danej dziedzinie. Tak jak laureaci Nagrody Nobla są wybierani przez panele ekspertów z każdej dziedziny, którzy oceniają kreatywność wkładu w ich dziedziny, tak CAT zatrudnia ekspertów z danej dziedziny do oceny kreatywności rzeczywistych produktów w tej dziedzinie. Osądy ekspertów mogą oczywiście zmieniać się w czasie; standardy w każdej dziedzinie, czy to artystycznej, naukowej czy praktycznej, nie są niezmienne i to, co może być postrzegane jako kreatywne w jednej epoce, może być uważane za mniej kreatywne w innej (i vice versa), podobnie jak kwalifikacje ekspertów w każdej dziedzinie. Jednak najlepszą możliwą oceną kreatywności dowolnego produktu w danym momencie jest zbiorowa ocena uznanych ekspertów w tej dziedzinie. Nie ma po prostu lepszego dostępnego miernika (Baer & McKool, 2009, 201420092014).
Eksperci dokonujący oceny kreatywności w ocenie CAT dokonują swoich osądów niezależnie – nie ma możliwości, aby wpłynęli na opinię innych – co pozwala na sprawdzenie wiarygodności międzyosobowej, która jest generalnie dość dobra. W zależności od ocenianych artefaktów potrzebni są oczywiście różni eksperci. Poeci, krytycy poezji i nauczyciele poezji mogą służyć jako sędziowie, jeśli artefaktami, o których mowa, są wiersze haiku, podczas gdy artyści, krytycy sztuki i nauczyciele sztuki byliby odpowiedni, gdyby artefaktami były kolaże. Każdy ekspert jest proszony o indywidualną ocenę kreatywności każdego produktu w badaniu w odniesieniu do wszystkich pozostałych w próbie, a nie w porównaniu z jakimkolwiek zewnętrznym standardem. Wszystkie oceny są relatywne w stosunku do kreatywności innych artefaktów w ocenianej grupie. Skala typu Likerta jest używana tak, aby oceny były rozłożone w całym zakresie możliwych ocen, a sędziowie są zachęcani do używania pełnej skali, oceniając najbardziej kreatywne artefakty w grupie przy najwyższej punktacji i najmniej kreatywne przy najniższej punktacji, w celu zróżnicowania porównawczej kreatywności wśród artefaktów w grupie. Średnie oceny wszystkich sędziów (których liczba w typowym badaniu może wynosić 10-15) są wykorzystywane jako oceny kreatywności każdego z artefaktów (Amabile, 1996; Baer, Kaufman, & Gentile, 2004; Kaufman et al., 2008a).
Proces jest zarówno prosty, jak i nieskomplikowany, choć prostota niestety nie przekłada się ani na łatwość, ani na koszty. W przeciwieństwie do studentów, którzy tworzą pulę tematyczną dla tak wielu badań psychologicznych, eksperci nie są tak swobodnie dostępni. Potrzebne są różne rodzaje ekspertów, w zależności od rodzaju artefaktów, które mają być oceniane, a eksperci są zazwyczaj opłacani za swoją pracę. Niektóre badania wykazały, że quasi-eksperci w niektórych dziedzinach (np. studenci w danej dziedzinie, którzy mogą jeszcze nie kwalifikować się jako eksperci) tworzą oceny raczej podobne do ocen ekspertów, co może nieco zmniejszyć koszty. Wykorzystanie początkujących oceniających (takich jak studenci college’u) rzadko jednak daje takie same oceny jak eksperci, więc CAT generalnie wymaga sędziów z co najmniej umiarkowanym poziomem wiedzy w danej dziedzinie i dlatego jest droższy niż wiele innych metod oceny kreatywności (Kaufman, Baer, & Cole, 2009b; Kaufman, Baer, Cole, & Sexton, 2008b; Kaufman, Baer, Cropley, Reiter-Palmon, & Sinnett, 2013a).
W rozdziale 2 dokonano szczegółowego przeglądu badań dotyczących specyficzności i ogólności dziedziny kreatywności, w dużej mierze z wykorzystaniem CAT. Wyniki były dość spójne i wykazywały niewielką ogólność domenową. Kluczową metodologią badań było dawanie osobom badanym szeregu różnych zadań z różnych dziedzin (np. stworzenie kolażu, napisanie wiersza, napisanie opowiadania), poddawanie ich niezależnym ocenom kreatywności za pomocą CAT przez panele ekspertów z poszczególnych dziedzin, a następnie poszukiwanie korelacji między ocenami w różnych dziedzinach. Dwie konkurujące ze sobą teorie – ogólności i specyficzności domeny – dają różne przewidywania dotyczące rzeczywistych osiągnięć twórczych. Oto jak jeden z badaczy kreatywności zwięźle podsumował, czym różnią się te przewidywania:
Domenowa ogólność byłaby wspierana przez wysokie korelacje pomiędzy różnymi kreatywnymi zachowaniami … podczas gdy specyficzność domeny byłaby wspierana przez stosunkowo niskie korelacje pomiędzy różnymi zachowaniami. (Ivcevic, 2007, s. 272)
Korelacje raportowane w wielu badaniach, które dokonały dokładnie tego porównania, miały tendencję do unoszenia się wokół zera (szczególnie jeśli usunięto wariancję przypisywaną inteligencji; Rozdział 2 szczegółowo omawia te badania, ale zobacz Baer, 2010, 201320102013 dla podsumowania), a nawet autorzy, którzy twierdzili, że znaleźli pewien stopień ogólności domeny, zazwyczaj znajdują go tylko w obrębie domen. Na przykład Conti, Coon i Amabile (1996) odnotowali korelacje ocen kreatywności w kilku zadaniach związanych z pisaniem opowiadań, wynoszące od 0,43 do 0,87, oraz mniejsze, ale wciąż istotne statystycznie korelacje pomiędzy kilkoma różnymi zadaniami artystycznymi (zadania artystyczne były mniej podobne do siebie niż zadania związane z pisaniem, więc taki wynik był oczekiwany). Wszystkie te wyniki są jednak korelacjami wewnątrzdziedzinowymi, a zatem pokazują jedynie, że w obrębie jednej dziedziny (takiej jak pisanie opowiadań czy sztuka) istnieje pewna ogólność, jak przewidują zarówno specyficzność dziedziny, jak i ogólność dziedziny. W przeciwieństwie do wielu statystycznie istotnych korelacji wewnątrzdziedzinowych, jednak spośród 13 korelacji międzydziedzinowych (pisanie-sztuka) – tych, które mają znaczenie dla specyficzności domeny – wszystkie były niewielkie, a niezależnie od tego, czy były pozytywne czy negatywne, żadna nie była statystycznie istotna. Tak więc pomimo twierdzeń tych autorów o dowodach na ogólność domeny, wszystko co faktycznie znaleźli to ogólność wewnątrz-domenowa (tj. specyficzność domeny).
Feist (2004) skomentował, że jest to „pociągające i ostatecznie mocno amerykańskie pojęcie, że kreatywna osoba może być kreatywna w każdej domenie, którą wybrała. Wszystko, co osoba ta musiałaby zrobić, to zdecydować, gdzie zastosować swoje talenty i wysiłki, dużo ćwiczyć lub trenować, i voila, masz twórcze osiągnięcia”. W tym ujęciu talent bierze górę nad dziedziną, a to, w jakiej dziedzinie wyraża się twórcze osiągnięcie, jest w pewnym sensie arbitralne.” Choć pociągające, Feist doszedł do wniosku, że „jest to dość naiwne i ostatecznie fałszywe stanowisko, a talent twórczy jest w rzeczywistości specyficzny dla danej dziedziny… kreatywność i talent zazwyczaj nie należą do umiejętności ogólnych” (s. 57).2
Po zapoznaniu się z dowodami za i przeciw specyficzności domeny w Rozdziale 2, Rozdziały 3-63456 analizują, co te wyniki badań oznaczają dla teorii twórczości, badań nad twórczością, testowania twórczości i treningu twórczości, a następnie przyglądają się, jakie rodzaje teorii twórczości byłyby wykonalne w warunkach specyficzności domeny. Chociaż czytelnicy są zaproszeni do przeczytania każdego z tych rozdziałów w kolejności, zostały one napisane ze zrozumieniem, że wielu czytelników będzie miało szczególne zainteresowania tylko jednym lub kilkoma z rozdziałów. Pomijanie rozdziałów nie powinno powodować wielkiego zamieszania (chociaż pisanie ich w taki sposób, aby było to możliwe, wymagało okazjonalnego powtarzania niektórych kluczowych idei i wyników badań). Czytelnicy już zaznajomieni (i przekonani przez) dowody badawcze wspierające specyficzność domeny, na przykład, mogą zechcieć pominąć obszerny przegląd tych dowodów w Rozdziale 2, który obejmuje bardziej szczegółowo niektóre z dowodów przedstawionych bardziej skrótowo w tym rozdziale.