Iluzje poznawcze
Informacje zmysłowe są często niejednoznaczne, ale efektywne kierowanie zachowaniem wymaga od nas szybkiego dochodzenia do jednoznacznych interpretacji percepcyjnych. Aby to zrobić, uzupełniamy informacje sensoryczne o wcześniejszą wiedzę i doświadczenie z podobnych sytuacji. Możemy myśleć o tej wcześniejszej wiedzy jako o dającej nam „najlepsze przypuszczenia” na temat prawdopodobnego stanu świata. Ta strategia prowadzi nas do właściwej interpretacji szybko przez większość czasu, ale jeśli nasze założenia są błędne, nasze postrzeganie będzie mylne. Iluzje poznawcze są często wyjaśniane w kategoriach takich błędnych założeń. Termin „poznawcze” nie oznacza, że założenia są świadomie przyjęte: są one zazwyczaj poniżej radaru świadomości, głęboko zakorzenione, a nawet niewzruszone. To wyjaśnia, dlaczego złudzenia poznawcze mogą utrzymywać się w niezmienionym stanie nawet wtedy, gdy wiemy, że zostaliśmy oszukani. Iluzje poznawcze mogą powstać dla każdej modalności sensorycznej, a także dla percepcji opartej na wielu modalnościach, ale wizja ponownie dostarcza obfitości przykładów.
Niektóre uderzające iluzje wizualne wynikają z percepcyjnych mechanizmów stałości. Te mechanizmy stałości zazwyczaj utrzymują nas przy prawdziwych właściwościach obiektów, niezależnie od zmian w stymulacji, którą nam one przedstawiają. Przekonującym przykładem jest stałość jasności, dobrze zilustrowana przez iluzję szachownicy Adelsona (ryc. 4A). Możemy niechętnie przyjąć, że płytki A i B mają dokładnie ten sam odcień szarości, ponieważ B wydaje nam się dużo jaśniejsza, ale nasze postrzeganie jasności płytki jest zdeterminowane nie przez bezwzględną ilość światła, które odbija, ale przez oszacowanie, jaką część światła padającego na nią odbija. Płytka B wydaje się być w cieniu, więc widzimy, że jasna płytka odbija większość swojego niewyraźnego oświetlenia. Płytka A wydaje się nie być w cieniu, więc widzimy ciemną płytkę odbijającą stosunkowo mniejszą część silniejszego oświetlenia. Podobne korekty dokonujemy dla koloru źródła światła, w celu wnioskowania o właściwościach odbicia powierzchniowego obiektów w scenie (stałość koloru). Truskawki na rys. 4B są odwzorowane w odcieniach szarości, ale widzimy je jako czerwone, ponieważ automatycznie dostosowujemy się do widocznego na zdjęciu niebiesko-zielonego oświetlenia. Takie efekty ilustrują zadziwiającą zdolność systemu percepcyjnego do kompensowania dużych różnic w warunkach oświetlenia.
Inną stałością percepcyjną jest stałość kształtu, która opisuje naszą zdolność do dostosowania się do zmian w kształcie i wielkości obrazów wyświetlanych dla naszego oka, gdy widzimy obiekt z różnych punktów widzenia. Optyczna projekcja okrągłej monety na stole przed Tobą jest szeroką elipsą, ale Twoja percepcja kompensuje skróconą perspektywę i widzisz monetę jako okrąg. Stałość kształtu może wywoływać silne złudzenia, gdy dwuwymiarowe (płaskie) obrazy są interpretowane przy użyciu założeń właściwych dla obiektów pełnych. Blaty stołu Sheparda na ryc. 4C są identycznymi równoległobokami – jeden mógłby być nałożony dokładnie na drugi – ale ponieważ interpretujemy je jako bryły obrócone w różnej głębi, nasza percepcja kompensuje skrócenie długości jednego stołu i szerokości drugiego. Rezultatem jest to, że obiektywnie identyczne blaty stołu wydają się nam radykalnie różne, jeden długi i wąski, drugi krótki i szeroki (Shepard, 1990).
Jednym z aspektów stałości kształtu jest stałość wielkości, która opisuje tendencję do skalowania bardziej odległych obiektów w percepcji. Pozwala nam to postrzegać obiekty jako względnie stabilne pod względem wielkości pomimo zmian w odległości patrzenia. Optyczny obraz twojej odchodzącej przyjaciółki zmniejsza się o połowę, gdy jest ona dwa razy dalej, ale nie postrzegasz jej jako zmniejszającej się; twoja percepcja jej zmniejszającego się obrazu jest stopniowo skalowana, aby skompensować zwiększoną odległość widzenia. Dobrym sposobem, aby docenić siłę tego percepcyjnego przeskalowania, jest wpatrywanie się w jasne źródło światła, takie jak żarówka lampy, przez minutę lub dwie. Po tym czasie ciemny kleks (negatywny powidok światła) będzie się wydawał rzutowany na każdą bladą powierzchnię, na którą spojrzymy. Optyczna wielkość tego powidoku jest stała, odpowiadająca plamce siatkówki wystawionej na działanie silnego światła, ale jego postrzegana wielkość będzie się drastycznie różnić w zależności od odległości od powierzchni, na którą patrzysz. Kleks będzie wyglądał na znacznie mniejszy na białej karcie trzymanej w dłoni niż na odległej ścianie; można nawet obserwować, jak kurczy się i rośnie, gdy przesuwamy kartę w kierunku i od twarzy lub idziemy w kierunku i od ściany.
Tak jak w przypadku blatów stołu Sheparda, stałość rozmiaru może tworzyć silne iluzje, gdy interpretujemy płaski obraz tak, jakby był sceną w głębi. Rozważmy iluzję Ponzo na Rys. 4D, w której górna linia wydaje się dłuższa niż (identyczna) linia pod nią. Głównym źródłem tego efektu może być to, że postrzegamy zbiegające się linie boczne jako projekcję równoległych linii w świecie, jak tory kolejowe cofające się w oddali. Górna linia jest zatem interpretowana jako odległa, więc jest percepcyjnie skalowana, aby to skompensować. Ten sam efekt można wywołać w obrazach rzeczywistych scen, odtwarzając element obrazu z pierwszego planu w dalszej pozornej odległości; absurdalne powiększenie odległych białych furgonetek na Rys. 4E pokazuje nam, w jakim stopniu nasze postrzeganie wielkości jest zwykle skalowane przez odległość. Nawet w niektórych rzeczywistych scenach, błędna interpretacja wskazówek dotyczących odległości może przyczynić się do powstania iluzji wielkości. Na przykład, księżyc może wydawać się znacznie większy, gdy znajduje się nisko na horyzoncie, niż gdy jest wysoko na niebie. To niebiańskie złudzenie zastanawiało ludzi przez wieki, a wiele teorii zostało zaproponowanych w celu jego wyjaśnienia (Ross i Plug, 2002). Jedną z nich jest to, że kiedy Księżyc znajduje się na horyzoncie, zazwyczaj istnieją przeszkody, takie jak budynki i drzewa, które wskazują odległość, więc postrzegany rozmiar wzrasta. Inna jest taka, że kiedy widzimy Księżyc wysoko na bezbarwnym niebie, nasze oczy mogą skupić się i zafiksować na mniejszej odległości, więc postrzegana wielkość maleje. Jednak podczas gdy z łatwością potrafimy określić pozorną wielkość Księżyca, możemy mieć mniejszą świadomość wskazówek dotyczących odległości, które na nią wpływają. Rzeczywiście, jeśli zapytany bezpośrednio, ludzie ogólnie oceniają księżyc być bliżej, gdy jest na horyzoncie, być może rozumując (błędnie), że jeśli wygląda większy to musi być bliżej.
W kilku z tych złudzeń, zwłaszcza gdy jesteśmy oszukiwani przez zdjęcia, wydaje się trochę niesprawiedliwe, aby powiedzieć, że jesteśmy naprawdę błędne, ponieważ percepcja będzie niezmiennie dokładne w prawdziwym świecie. Dachówka, która jest szara w cieniu, miałaby rzeczywiście jasny kolor powierzchni, truskawka, która jest szara w niebiesko-zielonym świetle, byłaby rzeczywiście czerwonym owocem, a stoły Sheparda byłyby dwoma meblami o bardzo różnych kształtach. Biorąc pod uwagę, że nasze systemy percepcyjne rozwinęły się w drodze ewolucji i w ciągu każdego życia, aby wspierać zaangażowanie w realny świat, te percepcje można uznać raczej za sukcesy niż porażki. Jesteśmy zoptymalizowani, aby widzieć właściwości powierzchni obiektów, a nie poszczególne długości odbijanych fal, oraz aby rozumieć kształty obiektów bryłowych, a nie rzuty na płaską płaszczyznę (co może wymagać lat treningu artystycznego). Kiedy iluzje pojawiają się w rzeczywistych scenach, to zazwyczaj dlatego, że scena jest bardzo mało prawdopodobna lub po prostu nie jest taka, do której nasz system został zaprojektowany. Na przykład, nasze wyrafinowane mechanizmy oceny odległości i rozmiarów zawodzą w przypadku ciał niebieskich, ponieważ odległości i rozmiary są tak dalekie od naszego doświadczenia i nie ma znaczenia, czy postrzegamy je dokładnie, czy nie. Można bezpiecznie założyć, że nikt nigdy nie umarł, ponieważ źle ocenił wielkość księżyca.
Jeśli jesteśmy zaprojektowani do aktywnego zaangażowania się w ziemskim świecie stałych obiektów, może to wyjaśniać, dlaczego nie możemy uniknąć zobaczenia interpretacji głębi obrazu, gdzie jeden jest możliwy, nawet jeśli wiemy, że obraz jest w rzeczywistości płaski. Jesteśmy tak przyzwyczajeni do perspektywy i cieniowania w sztuce, a także do fotografii i wideo, że łatwo zapominamy, jakie niezwykłe iluzje głębi nam one dają. Być może głównym powodem, dla którego filmy 3D, dodające stereoskopową głębię do doświadczenia kinowego, nigdy nie zawładnęły wyobraźnią, jest fakt, że tak bogatą głębię otrzymujemy już z filmów 2D. Gdy je oglądamy, nasz wzrok robi to, co przychodzi mu naturalnie (analizuje strukturę głębi sceny), ale z bodźcem, który z natury jest bardzo mało prawdopodobny (płaska reprezentacja sceny). Powtarza to bardziej ogólny punkt dotyczący złudzeń poznawczych: założenia, które nasze systemy percepcyjne przyjmują na temat prawdopodobnych przyczyn doznań, opierają się na znanym nam świecie stałych obiektów, które zachowują się w (przeważnie) przewidywalny sposób. Kiedy stajemy w obliczu nieprawdopodobnych sytuacji, gdzie te założenia się nie sprawdzają, wtedy nasze najlepsze przypuszczenia mogą być błędne i iluzoryczne błędne postrzeganie będzie następstwem.
Poza płaszczyzną obrazu, niektóre zaskakujące iluzje mogą być wywołane przez nieprawdopodobne trójwymiarowe struktury, które zapraszają nas do błędnej interpretacji ich kształtu. Adelbert Ames Jr. wymyślił kilka diabelnie sprytnych konstrukcji. Najbardziej znaną z nich jest pokój, który wydaje się być prostopadłościanem, gdy patrzy się na niego przez wizjer w jednej ze ścian, ale który w rzeczywistości nie ma w ogóle kątów prostych i jest geometrycznie rozciągnięty tak, że jeden z narożników jest znacznie dalej od oka niż drugi (Rys. 5A). Wrażenie wizualne jest takie, że zwrócone ku sobie narożniki są równomiernie oddalone, więc nie dochodzi do przeskalowania stałych rozmiarów, gdy widzimy osobę przechodzącą z jednej strony na drugą, a ona sama wydaje się rosnąć i kurczyć. Współczesnym mistrzem iluzji 3D jest matematyk Kokichi Sugihara, który wśród innych niezwykłych obiektów skonstruował zestaw „magnetycznie podobnych zboczy”, po których piłki wydają się toczyć pod górę (ryc. 5B) (Sugihara, 2014). Takie drobiazgowe konstrukcje tak mocno utrwalają nasze założenia dotyczące prawdopodobnego kształtu obiektu, że jesteśmy zmuszeni rozluźnić nasze intuicje, że piłki nie toczą się pod górę lub że ludzie nie zmieniają w magiczny sposób rozmiarów. Efekty te działają najlepiej, gdy oglądamy je jednym okiem – lub kamerą – z ustalonej pozycji, dzięki czemu obraz dokładnie odpowiada intencjom iluzjonisty, a widzenie obuoczne lub zmiana punktu widzenia nie dają żadnych sprzecznych wskazówek dotyczących głębi. Gdy tylko widzowi pozwoli się zbadać scenę poprzez poruszanie się po niej, ujawnia się prawdziwa struktura głębi i czar zostaje przerwany. Tak więc, choć trójwymiarowe w konstrukcji, iluzje te nadal ostatecznie czerpią swoje efekty z płaskich obrazów, które wyświetlają.
More tolerant of multiple perspectives, and also easier to set-up, is the hollow-mask illusion. Maska widziana od tyłu wcale nie wydaje się pusta, lecz wypukła (zakrzywiona na zewnątrz) (ryc. 5C). To iluzoryczne odwrócenie głębi jest dość silne, szczególnie przy oglądaniu z jednym okiem zamkniętym i z wydrążoną maską oświetloną od dołu tak, że cienie i światła padają tak jak na masce wypukłej oświetlonej konwencjonalnie od góry. Nawet z otwartymi obojgiem oczu, można zbliżyć się do wydrążonej maski na odległość około półtora metra, zanim widzenie obuoczne rozwieje złudzenie. Zazwyczaj podawane wyjaśnienie jest takie, że na podstawie wcześniejszych doświadczeń mamy silne oczekiwania, że twarze są wypukłe, więc trzymamy się tej interpretacji. Ale oczekiwania to tylko część historii; konieczne jest również, aby dostępne wskazówki sensoryczne pozostawiały miejsce na niejednoznaczność. Dlatego też iluzja jest wzmacniana, gdy binokularne wskazówki głębi są zredukowane (przez zamknięcie jednego oka lub patrzenie z odległości) lub dodane są wskazówki wprowadzające w błąd (przez zmianę kierunku oświetlenia). Jeśli wskazówki głębokościowe są wystarczająco niejednoznaczne, to iluzoryczne odwrócenie może być uzyskane dla wielu innych form, takich jak puste formy galaretowate lub druciane modele kształtów geometrycznych (np. sześcian z drutu). Niemniej jednak, efekt ten jest najsilniejszy w przypadku obiektów bardzo dobrze znanych, takich jak wyprostowane twarze, co do których mamy silne oczekiwania, że są wypukłe (Hill i Johnston, 2007). Im silniejsze są nasze wcześniejsze oczekiwania, tym bardziej będą one miały tendencję do unieważniania dowodów sensorycznych i odwrotnie.
Tak jak nasza percepcja powstaje w procesie integracji wcześniejszych oczekiwań z dowodami sensorycznymi, tak my musimy integrować dowody z wielu kanałów sensorycznych. Sos bulgoczący na twojej patelni ma kolor i teksturę, wydaje delikatne dźwięki poppingu, stawia fizyczny opór przy mieszaniu i (miejmy nadzieję) pachnie pysznie. Te aspekty zmysłowe łączą się, aby stworzyć jednolite doświadczenie percepcyjne gotowania i są bardziej współzależne, niż mogłoby się wydawać. Tę współzależność można zademonstrować, tworząc sztuczne niedopasowanie pomiędzy kanałami sensorycznymi. W takich okolicznościach informacje pochodzące z wizji mają tendencję do dominowania nad pozostałymi zmysłami. Brzuchomówstwo znane jest jako „podrzucanie głosu”, ponieważ brzuchomówca sprawia, że jego własny głos wydaje się pochodzić z innego miejsca, ale sztuczka polega przede wszystkim na precyzyjnym kontrolowaniu tego, co widzi publiczność. Brzuchomówca ukrywa swoje własne ruchy podczas gdy porusza ustami manekina wraz z mową, aby zasugerować alternatywne źródło, na które patrzy tak, jakby to była osoba mówiąca. Nawet bez tak wyszukanego oszustwa, automatycznie lokalizujemy głosy w filmach jako aktorów, chociaż system dźwiękowy może znajdować się kilka metrów od ekranu.
Informacja wizualna może zrobić więcej niż tylko przesunąć postrzeganą lokalizację głosu, może zmienić kształt dźwięków mowy, które słyszymy. W efekcie McGurka słyszymy nagranie audio osoby powtarzającej sylabę „ba-ba”, której towarzyszy zsynchronizowane nagranie wideo przedstawiające osobę wypowiadającą sylabę z inną początkową spółgłoską (np. „da-da”, „va-va”).3 Sylaba, którą słyszymy, zależy od ruchów mowy, które widzimy, a nasza percepcja słuchowa zmienia się z „ba” na „da” na „va”, gdy to samo nagranie audio jest połączone z różnymi nagraniami wideo. Wzrok może również wpływać na nasze wrażenia smakowe, dlatego wygląd potrawy jest tak istotny dla doznań podczas jedzenia. Podobno warzywa smakują bardziej świeżo, jeśli są żywiej zabarwione, a sok jabłkowy smakuje jak malina, jeśli doda się do niego bezsmakowy czerwony barwnik. Ten sam czerwony barwnik, po dodaniu do białego wina, może oszukać ekspertów w dziedzinie degustacji wina i sprawić, że będą oni zgłaszać nuty smakowe typowe dla czerwonego wina (Spence, 2010). Podobnie, nasz zmysł równowagi może być dosłownie kołysany przez wizję: jeśli jesteśmy umieszczeni wewnątrz „pokoju huśtawkowego”, w którym stoimy na solidnej podłodze, a ściany są lekko kołysane wokół nas, poczujemy, że spadamy w kierunku zbliżającej się ściany i pochylimy się korekcyjnie do tyłu, aby to skompensować (a młodsze dzieci zazwyczaj się przewrócą) (Lee i Aronson, 1974).
Iluzje wielozmysłowe nie wszystkie dotyczą wizji. Złudzenie pergaminowo-skórne opisuje niepokojący efekt, jaki dźwięk może mieć na nasz zmysł dotyku. Jeśli potrzemy nasze ręce i usłyszymy dźwięk, który wydają przez słuchawki, ale zremiksowany tak, aby podkreślić wysokie częstotliwości, nasze ręce będą suche i łuszczące się. Ten sam zabieg dźwiękowy ma bardziej przyjemny wpływ na doświadczenie jedzenia chipsów, które są oceniane jako świeższe i bardziej chrupiące, gdy słyszymy więcej wysokich częstotliwości, gdy je gryziemy. Efekty te powstają, ponieważ nasz system percepcyjny, dochodząc do interpretacji jakiegokolwiek zdarzenia, integruje dowody ze wszystkich dostępnych źródeł sensorycznych, jak również czerpie z wcześniejszej wiedzy na temat tego, co jest najbardziej prawdopodobne. Jeśli efekt McGurka lub złudzenie pergaminowej skóry wydają się zaskakujące, to dzieje się tak głównie z powodu mylnego wyobrażenia, że nasze zmysły są oddzielne i odrębne, a nie bogato przenikają się w doświadczeniu. Podobnie jak w przypadku innych złudzeń poznawczych, wątpliwe jest, czy słuszne jest myślenie o tych wielozmysłowych efektach jako o niepowodzeniach percepcji, gdy tak naprawdę są one raczej dobrymi domysłami na temat całkowitego wzorca stymulacji.
Jedną z wielozmysłowych iluzji, która zawładnęła wyobraźnią wielu badaczy, jest iluzja gumowej ręki (Botvinick i Cohen, 1998). Osoba siedzi przed manekinem ręki, która jest głaskana i szturchana przez eksperymentatora. Druga ręka eksperymentatora stosuje zsynchronizowaną serię uderzeń i pchnięć do prawdziwej ręki osoby, która jest ukryta za zasłaniającym ekranem. W ten sposób osoba widzi wzorzec dotknięć atrapy ręki, jednocześnie czując odpowiadające im dotknięcia. Wie, że ręka jest sztuczna, ale nie może uniknąć wrażenia, że jest ona w jakiś sposób częścią jej ciała; zbieżność wzroku i dotyku jest zbyt mało prawdopodobna, by można ją było zinterpretować w inny sposób. Żywotność tego złudzenia dobrze demonstrują automatyczne reakcje obronne osoby, która widzi, że ręka jest zagrożona, na przykład nożem lub młotkiem. Jest to tylko jeden przykład z całej gamy „iluzji ucieleśnienia”, które obejmują układy sprawiające, że czujemy się tak, jakbyśmy znajdowali się w ciele manekina, zabawkowej lalki, takiej jak Barbie czy Ken, lub że stoimy poza naszym ciałem, patrząc na nie (Petkova i Ehrsson, 2008). Ta gotowa przebudowa naszego poczucia „ja” sugeruje, że nawet ten najbardziej osobisty aspekt naszej percepcyjnej rzeczywistości jest pośrednim wnioskowaniem, najlepszą próbą naszego mózgu, aby zinterpretować dostępne dowody.
Iluzje wrażeń, które zależą od integracji wizji i dotyku mogą być przekonujące, ale zazwyczaj są raczej ograniczone, ponieważ są pasywne. Jeśli osoba decyduje się na wykonanie ruchu, ale ręka manekina nie spełnia wymagań, to zaprzecza to jej poczuciu własności i iluzja się kończy. Byłoby to bardziej przekonujące, aktywne doświadczenie, gdyby osoba mogła poruszać ręką manekina według własnego uznania, a także czuć i manipulować obiektami, których dotyka. Nowoczesna rzeczywistość wirtualna, z panoramicznym obrazem o wysokiej rozdzielczości, dźwiękiem przestrzennym oraz dotykowymi rękawicami i kombinezonami, zmierza w kierunku takich właśnie wciągających doświadczeń. Wystarczająco zaawansowany system tego rodzaju byłby nie do odróżnienia od świata fizycznego, więc niezależnie od tego, czy nasza rzeczywistość jest iluzją, czy nie, wystarczająco kompletna iluzja mogłaby stać się naszą rzeczywistością.