Illusioni cognitive
Le informazioni sensoriali sono spesso ambigue ma la guida efficiente del comportamento ci richiede di arrivare rapidamente a interpretazioni percettive non ambigue. Per fare questo, integriamo le informazioni sensoriali con la conoscenza precedente e l’esperienza di situazioni simili. Possiamo pensare a questa conoscenza precedente come se ci desse delle ipotesi “best-guess” sullo stato probabile del mondo. Questa strategia ci porta rapidamente all’interpretazione giusta la maggior parte delle volte, ma quando le nostre ipotesi sono sbagliate le nostre percezioni saranno sbagliate. Le illusioni cognitive sono spesso spiegate in termini di tali presupposti mal applicati. Il termine “cognitivo” non implica che le assunzioni siano fatte coscientemente: sono generalmente sotto il radar della consapevolezza, profondamente radicate e persino incrollabili. Questo spiega perché le illusioni cognitive possono persistere indisturbate anche dopo che sappiamo di essere stati ingannati. Le illusioni cognitive possono sorgere per qualsiasi modalità sensoriale e per percezioni basate su modalità multiple, ma la visione fornisce ancora una volta un’abbondanza di esempi.
Alcune illusioni visive sorprendenti risultano da meccanismi di costanza percettiva. Questi meccanismi di costanza ci mantengono normalmente in sintonia con le vere proprietà degli oggetti, indipendentemente dai cambiamenti nella stimolazione che essi ci presentano. Un esempio convincente è la costanza della luminosità, ben illustrata dall’illusione della scacchiera di Adelson (Fig. 4A). Possiamo essere riluttanti ad accettare che le piastrelle A e B siano esattamente della stessa tonalità di grigio perché B ci appare molto più chiara, ma la nostra percezione della luminosità della piastrella non è determinata dalla quantità assoluta di luce che riflette, ma da una stima della proporzione di luce incidente che riflette. La piastrella B sembra essere in ombra, quindi vediamo una piastrella chiara che riflette la maggior parte della sua fioca illuminazione. La mattonella A sembra non essere in ombra, quindi vediamo una mattonella scura che riflette relativamente meno della sua illuminazione più forte. Facciamo aggiustamenti simili per il colore della fonte di luce, al fine di dedurre le proprietà di riflessione della superficie degli oggetti nella scena (costanza di colore). Le fragole nella Fig. 4B sono rese in tonalità di grigio, ma noi le vediamo rosse perché ci regoliamo automaticamente per l’apparente illuminazione blu-verde dell’immagine. Tali effetti illustrano l’incredibile capacità del sistema percettivo di compensare ampie variazioni nelle condizioni di illuminazione.
Un’altra costanza percettiva è la costanza di forma, che descrive la nostra capacità di adattarsi alle variazioni di forma e dimensione delle immagini proiettate sul nostro occhio quando vediamo un oggetto da diversi punti di vista. La proiezione ottica di una moneta circolare su un tavolo di fronte a voi è una larga ellisse, ma la vostra percezione compensa la prospettiva scorciata, e vedete la moneta come un cerchio. La costanza della forma può produrre forti illusioni quando le immagini bidimensionali (piatte) sono interpretate usando ipotesi appropriate per oggetti solidi. I tavoli di Shepard in Fig. 4C sono parallelogrammi identici – uno potrebbe essere sovrapposto esattamente all’altro – ma poiché li interpretiamo come oggetti solidi ruotati diversamente in profondità, la nostra percezione compensa uno scorcio della lunghezza di un tavolo e della larghezza dell’altro. Il risultato è che i piani dei tavoli oggettivamente identici ci appaiono radicalmente diversi, uno lungo e stretto, l’altro corto e largo (Shepard, 1990).
Un aspetto della costanza di forma è la costanza di dimensione, che descrive la tendenza degli oggetti più lontani ad essere scalati nella percezione. Questo ci permette di vedere gli oggetti come relativamente stabili nelle dimensioni nonostante i cambiamenti nella distanza di osservazione. L’immagine ottica della vostra amica che se ne va dimezza le sue dimensioni quando diventa due volte più lontana, ma voi non la percepite ridursi; la vostra percezione della sua immagine che si riduce viene progressivamente ridimensionata per compensare l’aumento della distanza di osservazione. Un buon modo per apprezzare il potere di questo ridimensionamento percettivo è quello di fissare una fonte di luce brillante, come la lampadina di una lampada, per un minuto o due. In seguito, un blob scuro (l’afterimage negativo della luce) sembrerà essere proiettato su qualsiasi superficie chiara che guardate. La dimensione ottica di questa afterimage è costante, corrispondente alla zona della retina esposta alla luce forte, ma la sua dimensione percepita varierà drammaticamente con la distanza della superficie che si guarda. Il blob sembrerà molto più piccolo su un cartoncino bianco tenuto in mano che su una parete lontana; si può anche vederlo rimpicciolire e crescere mentre si sposta il cartoncino verso e lontano dal viso, o si cammina verso e lontano dal muro.
Come per i table-top di Shepard, la costanza delle dimensioni può creare forti illusioni quando interpretiamo un’immagine piatta come se fosse una scena in profondità. Consideriamo l’illusione di Ponzo nella Fig. 4D, in cui la linea superiore sembra più lunga della linea (identica) sottostante. Una delle principali cause di questo effetto può essere che vediamo le linee laterali convergenti come una proiezione di linee parallele nel mondo, come i binari del treno che si allontanano in lontananza. La linea superiore è quindi interpretata come più lontana e quindi è percettivamente scalata per compensare. Lo stesso effetto può essere indotto in immagini di scene reali riproducendo un elemento dell’immagine dal primo piano a una distanza apparente più lontana; l’assurdo ingrandimento dei furgoni bianchi lontani nella Fig. 4E ci mostra fino a che punto la nostra percezione delle dimensioni è normalmente scalata dalla distanza. Anche in alcune scene del mondo reale, l’errata interpretazione degli indizi di distanza può contribuire alle illusioni di grandezza. Per esempio, la luna può sembrare molto più grande quando è bassa all’orizzonte rispetto a quando è alta nel cielo. Questa illusione celeste ha sconcertato l’uomo per secoli, e sono state proposte diverse teorie per spiegarla (Ross e Plug, 2002). Un suggerimento è che, quando la luna è all’orizzonte, di solito ci sono elementi che intervengono come edifici e alberi per indicare la distanza, quindi la dimensione percepita aumenta. Un altro è che, quando vediamo la luna in alto in un cielo senza caratteristiche, i nostri occhi possono effettivamente mettere a fuoco e fissare a una distanza più breve, quindi la dimensione percepita diminuisce. Tuttavia, mentre possiamo riferire la dimensione apparente della luna con facilità, possiamo avere meno consapevolezza degli indizi di distanza che la influenzano. Infatti, se chiesto direttamente, le persone generalmente giudicano la luna più vicina quando è all’orizzonte, forse ragionando (erroneamente) che se sembra più grande allora deve essere più vicina.
In molte di queste illusioni, soprattutto quando siamo ingannati da immagini, sembra un po’ ingiusto dire che ci stiamo davvero sbagliando, perché la percezione sarebbe invariabilmente accurata nel mondo reale. Una piastrella che è grigia all’ombra avrebbe davvero un colore chiaro in superficie, una fragola che è grigia alla luce blu-verde sarebbe davvero un frutto rosso, e i tavoli di Shepard sarebbero due mobili di forma molto diversa. Considerando che i nostri sistemi percettivi si sono sviluppati, attraverso l’evoluzione e all’interno di ogni vita, per sostenere l’impegno con il mondo reale, queste percezioni potrebbero essere considerate successi piuttosto che fallimenti. Siamo ottimizzati per vedere le proprietà della superficie degli oggetti, non le particolari lunghezze d’onda riflesse, e per capire le forme degli oggetti solidi, non le proiezioni su un piano piatto (che possono richiedere anni di allenamento artistico). Quando si verificano illusioni nelle scene del mondo reale, di solito è perché la scena è molto improbabile o semplicemente non è quella per cui il nostro sistema è stato progettato. Per esempio, i nostri sofisticati meccanismi per giudicare le distanze e le dimensioni falliscono quando vengono applicati ai corpi celesti perché le distanze e le dimensioni coinvolte sono così al di fuori della nostra esperienza, e perché non importa se le percepiamo accuratamente o meno. Si può supporre che nessuno sia mai morto per aver giudicato male le dimensioni della luna.
Se siamo progettati per un impegno attivo con un mondo terrestre di oggetti solidi, questo può spiegare perché non possiamo evitare di vedere un’interpretazione di profondità di un’immagine, quando è possibile, anche se sappiamo che l’immagine è in realtà piatta. Siamo così abituati alla prospettiva e alle sfumature nell’arte, e alle fotografie e ai video, che è facile dimenticare le notevoli illusioni di profondità che ci danno. Forse la ragione principale per cui i film in 3D, che aggiungono profondità stereoscopica all’esperienza cinematografica, non hanno mai catturato l’immaginazione, è che otteniamo già una profondità così ricca dai film in 2D. Mentre li guardiamo, la nostra visione sta solo facendo ciò che viene naturale (analizzare la struttura di profondità di una scena) ma con uno stimolo che è molto improbabile in natura (una rappresentazione piatta di una scena). Questo ribadisce il punto più generale sulle illusioni cognitive: le ipotesi che i nostri sistemi percettivi fanno sulle cause probabili delle sensazioni si basano su un mondo familiare di oggetti solidi, che si comportano in modi (per lo più) prevedibili. Quando ci troviamo di fronte a situazioni improbabili, dove questi presupposti non reggono, allora le nostre migliori ipotesi possono essere sbagliate e ne conseguono percezioni illusorie errate.
Al di là del piano dell’immagine, alcune illusioni sorprendenti possono essere indotte da strutture tridimensionali improbabili che ci invitano a interpretare male la loro forma. Diverse costruzioni diabolicamente intelligenti sono state inventate da Adelbert Ames Jr. La più famosa di queste è una stanza che appare normalmente cuboide quando viene vista attraverso uno spioncino in una parete, ma che in realtà non ha affatto angoli retti ed è geometricamente allungata in modo che un angolo rivolto sia molto più lontano dall’occhio dell’altro (Fig. 5A). L’impressione visiva è che gli angoli di fronte siano equidistanti, quindi non si verifica alcun ridimensionamento della costanza delle dimensioni quando vediamo una persona camminare da un lato all’altro, e sembra crescere e restringersi mentre lo fa. Un maestro contemporaneo dell’illusione 3D è il matematico Kokichi Sugihara, che, tra gli altri oggetti straordinari, ha costruito una serie di “pendenze simili a calamite” su cui le palle sembrano rotolare in salita (Fig. 5B) (Sugihara, 2014). Costruzioni così meticolose stimolano le nostre ipotesi sulla probabile forma degli oggetti in modo così forte che siamo costretti a rilassare la nostra intuizione che le palle non rotolano in salita o che le persone non cambiano magicamente dimensione. Questi effetti funzionano meglio quando sono visti con un occhio solo – o con una telecamera – da una posizione fissa, in modo che l’immagine corrisponda esattamente all’intenzione dell’illusionista e non ci siano spunti di profondità contraddittori disponibili dalla visione binoculare o dal cambio di punto di vista. Non appena si permette allo spettatore di esplorare la scena muovendosi intorno ad essa, la vera struttura di profondità viene rivelata e l’incantesimo si rompe. Così, sebbene tridimensionali nella costruzione, queste illusioni derivano ancora, in ultima analisi, i loro effetti dalle immagini pittoriche piatte che proiettano.
Più tollerante alle prospettive multiple, e anche più facile da impostare, è l’illusione delle maschere cave. Una maschera vista da dietro non sembra affatto cava, ma convessa (curva verso l’esterno) (Fig. 5C). Questa inversione illusoria di profondità è abbastanza robusta, specialmente se si osserva con un occhio chiuso, e con la maschera vuota illuminata dal basso in modo che le ombre e le luci cadano come farebbero su una maschera convessa illuminata convenzionalmente dall’alto. Anche con entrambi gli occhi aperti, ci si può avvicinare a una maschera cava fino a circa un metro e mezzo prima che la visione binoculare dissipi l’illusione. La spiegazione usuale è che abbiamo forti aspettative, basate sull’esperienza precedente, che i volti siano convessi, quindi ci aggrappiamo a questa interpretazione. Ma le aspettative sono solo una parte della storia; è anche necessario che gli spunti sensoriali disponibili lascino spazio all’ambiguità. Quindi, l’illusione viene rafforzata quando gli spunti di profondità binoculare vengono ridotti (chiudendo un occhio o guardando da lontano) o vengono aggiunti spunti fuorvianti (cambiando la direzione della luce). Se gli spunti di profondità sono sufficientemente ambigui, allora si possono ottenere inversioni illusorie per molte altre forme, come stampi di gelatina vuoti o modelli di forme geometriche in filo metallico (ad esempio, un cubo di filo). Tuttavia, l’effetto è più robusto per gli oggetti altamente familiari, come i volti eretti, che ci aspettiamo fortemente siano convessi (Hill e Johnston, 2007). Più forti sono le nostre aspettative precedenti, più tenderanno a prevalere sulle prove sensoriali, e viceversa.
Come la nostra percezione nasce da un processo di integrazione delle aspettative precedenti con le prove sensoriali, così dobbiamo integrare le prove provenienti da più canali sensoriali. La salsa che bolle nella vostra padella ha colore e consistenza, emette suoni morbidi e schioccanti, oppone resistenza fisica al mescolamento e (si spera) ha un odore delizioso. Queste sfaccettature sensoriali si combinano per creare un’esperienza percettiva unificata della cottura, e sono più interdipendenti di quanto si possa pensare. Questa interdipendenza può essere dimostrata creando disadattamenti artificiali tra i canali sensoriali. In tali circostanze, l’informazione della vista tende a dominare gli altri sensi. Il ventriloquismo è conosciuto come “lanciare la propria voce” perché il ventriloquo fa sembrare che la propria voce provenga da un altro luogo, ma il trucco sta principalmente nel controllo preciso di ciò che il pubblico vede. Il ventriloquo nasconde i propri movimenti di parola, mentre muove una bocca fittizia insieme al discorso per suggerire una fonte alternativa, che guarda come se fosse una persona che parla. Anche senza un inganno così elaborato, nei film localizziamo automaticamente le voci agli attori, anche se il sistema audio può trovarsi a diversi metri dallo schermo.
Le informazioni visive possono fare più che spostare la posizione percepita di una voce, possono rimodellare i suoni del discorso che sentiamo. Nell’effetto McGurk, ascoltiamo una registrazione audio di una persona che ripete una sillaba, “ba-ba”, accompagnata da un video sincronizzato di una persona che pronuncia una sillaba con una consonante iniziale diversa (ad esempio, “da-da”, “va-va”).3 La sillaba che sentiamo dipende dai movimenti del discorso che vediamo, e la nostra percezione uditiva passa da “ba” a “da” a “va” quando la stessa registrazione audio è abbinata a video diversi. La visione può anche alterare le nostre impressioni gustative, ed è per questo che l’aspetto di un piatto è così importante per l’esperienza alimentare. Si dice che le verdure hanno un sapore più fresco se sono colorate in modo più vivace, e che il succo di mela sa di lampone se viene aggiunto un colorante rosso insapore. Lo stesso colorante rosso, se aggiunto al vino bianco, può ingannare i degustatori esperti nel riportare note di sapore tipiche dei rossi (Spence, 2010). Allo stesso modo, il nostro senso dell’equilibrio può essere letteralmente influenzato dalla visione: se siamo collocati all’interno di una “stanza oscillante”, in cui siamo in piedi su un pavimento solido e le pareti sono leggermente oscillate intorno a noi, sentiremo che stiamo cadendo verso una parete che si avvicina e ci piegheremo in modo corretto all’indietro per compensare (e i bambini più piccoli in genere cadranno) (Lee e Aronson, 1974).
Le illusioni multisensoriali non coinvolgono tutte la visione. L’illusione della pelle di pergamena descrive un effetto inquietante che il suono può avere sul nostro senso del tatto. Se ci strofiniamo le mani e sentiamo il suono che producono trasmesso in cuffia ma remixato per enfatizzare le alte frequenze, le nostre mani si sentiranno secche e sfaldate. Lo stesso trattamento sonoro ha effetti più piacevoli sull’esperienza di mangiare patatine, che sono valutate come più fresche e croccanti quando sentiamo più alte frequenze mentre le addentiamo. Questi effetti si verificano perché, nel raggiungere un’interpretazione di qualsiasi evento, il nostro sistema percettivo integra le prove da tutte le fonti sensoriali disponibili, oltre ad attingere a conoscenze precedenti su ciò che è più probabile. Se l’effetto McGurk o l’illusione della pelle di pergamena sembrano sorprendenti, ciò è dovuto principalmente a una nozione fuorviante che i nostri sensi sono separati e distinti piuttosto che riccamente mescolati nell’esperienza. Come altre illusioni cognitive, è discutibile se sia giusto pensare a questi effetti multisensoriali come a fallimenti della percezione, quando in realtà sono piuttosto buone ipotesi sul modello totale della stimolazione.
Un’illusione multisensoriale che ha catturato l’immaginazione di molti ricercatori è l’illusione della mano di gomma (Botvinick e Cohen, 1998). Una persona è seduta di fronte a una mano fittizia che viene accarezzata e pungolata da uno sperimentatore. L’altra mano dello sperimentatore applica una serie sincronizzata di carezze e pungoli alla mano reale della persona, che è nascosta dietro uno schermo occludente. La persona vede quindi un modello di tocchi alla mano fittizia mentre sente i tocchi corrispondenti. Sa che la mano è finta, ma non può sfuggire all’impressione che sia in qualche modo una parte del suo corpo; la coincidenza di vista e tatto è troppo improbabile per essere interpretata in qualsiasi altro modo. La vivacità di questa illusione è ben dimostrata dalle reazioni difensive automatiche della persona se vede la mano minacciata, per esempio da un coltello o un martello. Questo è solo un esempio di una serie di “illusioni di incarnazione”, che includono allestimenti che possono farci sentire come se fossimo nel corpo di un manichino, o di una bambola giocattolo come Barbie o Ken, o che siamo in piedi fuori dal nostro corpo a guardare (Petkova e Ehrsson, 2008). Questo pronto rimodellamento del nostro senso di sé suggerisce che anche questo aspetto più personale della nostra realtà percettiva è un’inferenza indiretta, il miglior tentativo del nostro cervello di interpretare le prove disponibili.
Le illusioni di ambiguità che dipendono dall’integrazione di vista e tatto possono essere convincenti, ma sono tipicamente piuttosto limitate perché sono passive. Se la persona decide di fare un movimento ma la mano fittizia non è conforme, questo contraddice il suo senso di proprietà e l’illusione è finita. Sarebbe un’esperienza più avvincente e attiva se la persona potesse muovere la mano fittizia a volontà, e sentire e manipolare gli oggetti che tocca. La moderna realtà virtuale, con visione panoramica ad alta risoluzione, suono surround, e guanti e tute con feedback tattile, si sta muovendo verso queste esperienze immersive. Un sistema abbastanza avanzato di questo tipo sarebbe indistinguibile da un mondo fisico; quindi, che la nostra realtà sia o meno un’illusione, un’illusione sufficientemente completa potrebbe diventare la nostra realtà.