Cognitive Illusions
Sensory information is often ambiguous but the efficient guidance of behavior requires us to arrive quickly at unambiguous perceptual interpretations. Para isso, complementamos a informação sensorial com conhecimento prévio e experiência de situações semelhantes. Podemos pensar neste conhecimento prévio como dando-nos suposições “de melhor palpite” sobre o provável estado do mundo. Esta estratégia nos leva à interpretação correta rapidamente na maioria das vezes, mas quando nossas suposições estão erradas, nossas percepções estarão erradas. As ilusões cognitivas são muitas vezes explicadas em termos de tais suposições mal aplicadas. O termo “cognitivo” não implica que as suposições sejam feitas conscientemente: elas estão geralmente abaixo do radar da consciência, profundamente enraizadas, e até mesmo inabaláveis. Isto explica porque é que as ilusões cognitivas podem persistir sem diminuir, mesmo depois de sabermos que estamos a ser enganados. Ilusões cognitivas podem surgir para qualquer modalidade sensorial, e para percepções baseadas em múltiplas modalidades, mas a visão novamente fornece uma abundância de exemplos.
Algumas impressionantes ilusões visuais resultam de mecanismos de constância perceptual. Esses mecanismos de constância normalmente nos mantêm sintonizados com as verdadeiras propriedades dos objetos independentemente das mudanças na estimulação que eles nos apresentam. Um exemplo convincente é a constância da leveza, bem ilustrada pela ilusão do tabuleiro de xadrez de Adelson (Fig. 4A). Podemos estar relutantes em aceitar que as telhas A e B são exatamente a mesma tonalidade de cinza porque B nos parece muito mais leve, mas nossa percepção da leveza da telha é determinada não pela quantidade absoluta de luz que ela reflete, mas por uma estimativa da proporção da luz incidente que ela reflete. O azulejo B parece estar na sombra, por isso vemos um azulejo de luz que reflecte a maior parte da sua fraca iluminação. O azulejo A parece não estar na sombra, então nós vemos um azulejo escuro refletindo relativamente menos de sua iluminação mais forte. Fazemos ajustes semelhantes para a cor da fonte de luz, a fim de inferir as propriedades de reflexão de superfície dos objetos na cena (constância de cor). Os morangos da Fig. 4B são renderizados em tons de cinza, mas nós os vemos como vermelhos porque nos ajustamos automaticamente para a aparente iluminação azul-verde na imagem. Tais efeitos ilustram a incrível capacidade do sistema perceptual para compensar grandes variações nas condições de iluminação.
Uma outra constância perceptual é a constância de forma, que descreve a nossa capacidade de ajuste para variações na forma e tamanho das imagens projectadas ao nosso olho quando vemos um objecto de diferentes pontos de vista. A projecção óptica de uma moeda circular sobre uma mesa à sua frente é uma elipse ampla, mas a sua percepção compensa a perspectiva de predilecção, e você vê a moeda como um círculo. A constância da forma pode produzir fortes ilusões quando imagens bidimensionais (planas) são interpretadas usando suposições apropriadas para objetos sólidos. As tábua de Shepard na Fig. 4C são paralelogramas idênticos – um poderia ser sobreposto exatamente sobre o outro – mas como nós os interpretamos como objetos sólidos girados diferentemente em profundidade, nossa percepção compensa um encurtamento do comprimento de uma mesa e da largura da outra. O resultado é que os pontos da tabela objectivamente idênticos parecem-nos radicalmente diferentes, um longo e estreito, o outro curto e largo (Shepard, 1990).
Um aspecto da constância da forma é a constância do tamanho, o que descreve a tendência para objectos mais distantes serem escalados na percepção. Isto permite-nos ver os objectos como relativamente estáveis em tamanho, apesar das mudanças na distância de visualização. A imagem ótica da sua amiga que parte fica metade do tamanho à medida que ela fica duas vezes mais distante, mas você não a percebe a encolher; a sua percepção da imagem encolhida é progressivamente aumentada para compensar o aumento da distância de visualização. Uma boa maneira de apreciar o poder deste redimensionamento perceptivo é olhar para uma fonte de luz brilhante, como a lâmpada de uma lâmpada, durante um minuto ou dois. Depois, uma bolha escura (a pós-imagem negativa da luz) parecerá ser projectada em qualquer superfície pálida para a qual se olhe. O tamanho óptico desta pós-imagem é constante, correspondendo à mancha de retina exposta à luz forte, mas o seu tamanho percebido irá variar drasticamente com a distância da superfície para a qual você olha. O blob vai parecer muito menor em uma carta branca segurada em sua mão do que em uma parede distante; você pode até vê-la encolher e crescer enquanto você move a carta na direção e longe de seu rosto, ou caminhar na direção e longe da parede.
Como com os tops de mesa da Shepard, a constância de tamanho pode criar fortes ilusões quando interpretamos uma imagem plana como se fosse uma cena em profundidade. Considere a ilusão de Ponzo na Fig. 4D, na qual a linha superior parece mais longa do que a linha (idêntica) abaixo dela. Uma fonte importante deste efeito pode ser que vemos as linhas laterais convergentes como uma projeção de linhas paralelas no mundo, como trilhos de trem recuando para a distância. A linha superior é assim interpretada como mais distante, pelo que é perceptualmente dimensionada para compensar. O mesmo efeito pode ser induzido em imagens de cenas reais através da reprodução de um elemento de imagem a partir do primeiro plano a uma distância mais aparente; o aumento absurdo das carrinhas brancas distantes na Fig. 4E mostra-nos até que ponto a nossa percepção do tamanho é normalmente escalada pela distância. Mesmo em algumas cenas do mundo real, a má interpretação dos sinais de distância pode contribuir para ilusões de tamanho. Por exemplo, a lua pode parecer muito maior quando está baixa no horizonte do que quando está alta no céu. Esta ilusão celestial intrigou os humanos durante séculos, e múltiplas teorias foram propostas para a explicar (Ross and Plug, 2002). Uma sugestão é que, quando a lua está no horizonte, geralmente há características intervenientes, como edifícios e árvores, para indicar a distância, de modo que o tamanho percebido aumenta. Outra é que, quando vemos a lua no alto de um céu sem características, nossos olhos podem realmente focar e fixar a uma distância menor, então o tamanho percebido diminui. No entanto, embora possamos relatar o tamanho aparente da lua com facilidade, podemos ter menos consciência das dicas de distância que a afetam. De fato, se perguntadas diretamente, as pessoas geralmente julgam que a lua está mais próxima quando ela está no horizonte, talvez raciocinando (erroneamente) que se ela parece maior então ela deve estar mais próxima.
Em várias dessas ilusões, especialmente quando somos enganados por imagens, parece um pouco injusto dizer que estamos realmente enganados, porque a percepção seria invariavelmente precisa no mundo real. Um azulejo cinzento à sombra teria de facto uma cor superficial clara, um morango cinzento à luz azul-verde seria de facto uma fruta vermelha, e as mesas da Shepard seriam duas peças de mobiliário com formas muito diferentes. Considerando que os nossos sistemas perceptuais se desenvolveram, através da evolução e dentro de cada vida, para apoiar o envolvimento com o mundo real, estas percepções poderiam ser consideradas sucessos e não fracassos. Estamos otimizados para ver as propriedades de superfície dos objetos e não os comprimentos de onda particulares refletidos, e para entender as formas dos objetos sólidos e não projeções para um plano plano plano (o que pode levar anos de treinamento artístico). Quando surgem ilusões em cenas do mundo real, geralmente é porque a cena é muito improvável ou simplesmente não é uma cena para a qual o nosso sistema foi projetado. Por exemplo, nossos sofisticados mecanismos para julgar distâncias e tamanhos falham quando aplicados a corpos celestes, porque as distâncias e tamanhos envolvidos estão tão distantes de nossa experiência, e porque não importa se nós os percebemos com precisão ou não. É seguro assumir que ninguém jamais morreu por julgar mal o tamanho da lua.
Se fomos projetados para o envolvimento ativo com um mundo terrestre de objetos sólidos, isto pode explicar porque não podemos evitar ver uma interpretação profunda de uma imagem, onde uma é possível, mesmo sabendo que a imagem é realmente plana. Estamos tão habituados à perspectiva e ao sombreamento na arte, e às fotografias e ao vídeo, que é fácil esquecer as notáveis ilusões de profundidade que eles nos dão. Talvez a principal razão pela qual os filmes 3D, que acrescentam profundidade estereoscópica à experiência cinematográfica, nunca agarraram a imaginação, seja o facto de já conseguirmos uma profundidade tão rica de filmes 2D. Ao vê-los, nossa visão é apenas fazer o que vem naturalmente (analisar a estrutura de profundidade de uma cena), mas com um estímulo que é muito improvável na natureza (uma representação plana de uma cena). Isto reitera o ponto mais geral sobre as ilusões cognitivas: as suposições que os nossos sistemas perceptivos fazem sobre as prováveis causas das sensações baseiam-se num mundo familiar de objectos sólidos, que se comportam de formas (na sua maioria) previsíveis. Quando nos deparamos com situações improváveis, onde essas suposições não se mantêm, então nossas melhores suposições podem estar erradas e se seguirão percepções errôneas ilusórias.
Além do plano da imagem, algumas ilusões surpreendentes podem ser induzidas por estruturas tridimensionais improváveis que nos convidam a interpretar mal a sua forma. Várias construções diabolicamente inteligentes foram inventadas por Adelbert Ames Jr. A mais célebre delas é uma sala que aparece normalmente cubóide quando vista através de um buraco na parede, mas que de fato não tem ângulos retos e é geometricamente esticada de modo que um canto voltado para o olho está muito mais distante do que o outro (Fig. 5A). A impressão visual é que os cantos de face são equidistantes, de modo que não ocorre qualquer redimensionamento constante de tamanho quando vemos uma pessoa caminhar de um lado para o outro, e eles parecem crescer e encolher à medida que o fazem. Um mestre contemporâneo da ilusão 3D é o matemático Kokichi Sugihara, que, entre outros objetos extraordinários, construiu um conjunto de “inclinações em forma de ímã” sobre as quais as bolas parecem rolar para cima (Fig. 5B) (Sugihara, 2014). Construções tão meticulosas dão a primazia às nossas suposições sobre a provável forma dos objetos, de tal forma que somos forçados a relaxar nossa intuição de que as bolas não rolam para cima ou que as pessoas não mudam magicamente de tamanho. Estes efeitos funcionam melhor quando vistos com um olho – ou uma câmara – a partir de uma posição fixa, de modo que a imagem corresponde exactamente à intenção do ilusionista e não existem sinais de profundidade contraditórios a partir da visão binocular ou da mudança de ponto de vista. Assim que o espectador é autorizado a explorar a cena movendo-se à sua volta, a verdadeira estrutura de profundidade é revelada e o feitiço é quebrado. Assim, embora em construção tridimensional, estas ilusões ainda acabam por derivar os seus efeitos das imagens pictóricas planas que projectam.
Mais tolerante a múltiplas perspectivas, e também mais fácil de configurar, é a ilusão da máscara oca. Uma máscara vista por trás não parece nada oca, mas convexa (curvada para fora) (Fig. 5C). Esta inversão de profundidade ilusória é bastante robusta, especialmente se vista com um olho fechado, e com a máscara oca iluminada por baixo para que as sombras e os destaques caiam como cairiam em uma máscara convexa iluminada convencionalmente por cima. Mesmo com ambos os olhos abertos, pode-se aproximar uma máscara oca a cerca de um metro e meio antes que a visão binocular dissipe a ilusão. A explicação habitual dada é que temos fortes expectativas, com base na experiência anterior, que os rostos são convexos, por isso nos agarramos a esta interpretação. Mas as expectativas são apenas parte da história; também é necessário que os sinais sensoriais disponíveis deixem espaço para a ambiguidade. Assim, a ilusão é reforçada quando as pistas de profundidade binocular são reduzidas (fechando um olho, ou vendo à distância) ou quando são acrescentadas pistas enganosas (mudando a direcção da iluminação). Se os sinais de profundidade forem suficientemente ambíguos, podem ser obtidas inversões ilusórias para muitas outras formas, tais como moldes de gelatina oca ou modelos de arame de formas geométricas (por exemplo, um cubo de arame). No entanto, o efeito é mais robusto para objectos altamente familiares, como rostos verticais, que esperamos fortemente que sejam convexos (Hill and Johnston, 2007). Quanto mais fortes forem nossas expectativas anteriores, mais elas tenderão a superar a evidência sensorial, e vice-versa.
Apenas à medida que nossa percepção surge de um processo de integração das expectativas anteriores com a evidência sensorial, então devemos integrar a evidência de múltiplos canais sensoriais. O molho borbulhante na sua panela tem cor e textura, faz sons suaves de popping, dá resistência física à agitação e (esperançosamente) cheira deliciosamente. Estas facetas sensoriais combinam-se para criar uma experiência perceptiva unificada de cozinhar, e são mais interdependentes do que você possa pensar. Esta interdependência pode ser demonstrada criando desajustes artificiais entre os canais sensoriais. Sob tais circunstâncias, a informação da visão tende a dominar os outros sentidos. O ventriloquismo é conhecido como “atirar a voz” porque o ventríloquo está a fazer com que a sua própria voz pareça vir de um lugar diferente, mas o truque está principalmente no controlo preciso do que o público vê. A ventríloqua esconde os seus próprios movimentos de fala, enquanto move uma boca falsa juntamente com o discurso para sugerir uma fonte alternativa, que ela olha como se fosse uma pessoa a falar. Mesmo sem esta elaborada decepção, nós localizamos automaticamente vozes em filmes para atores, embora o sistema de som possa estar a vários metros da tela.
A informação visual pode fazer mais do que apenas deslocar a localização percebida de uma voz, ela pode remodelar os sons da fala que ouvimos. No efeito McGurk, ouvimos uma gravação de áudio de uma pessoa repetindo uma sílaba, “ba-ba”, acompanhada por um vídeo sincronizado de uma pessoa falando uma sílaba com uma consoante inicial diferente (por exemplo, “da-da”, “va-va”).3 A sílaba que ouvimos depende dos movimentos da fala que vemos, e nossa percepção auditiva muda de “ba” para “da” para “va” quando a mesma gravação de áudio é emparelhada com vídeos diferentes. A visão também pode alterar as nossas impressões gustativas, e é por isso que o aspecto de um prato é tão integrante da experiência alimentar. Os legumes têm um sabor mais fresco se tiverem uma cor mais vibrante, e o sumo de maçã a gosto de framboesa se for adicionado um corante vermelho sem sabor. A mesma coloração vermelha, quando adicionada ao vinho branco, pode enganar os provadores de vinho especializados em relatar notas de sabor típicas dos tintos (Spence, 2010). Da mesma forma, nosso senso de equilíbrio pode ser literalmente balançado pela visão: se formos colocados dentro de uma “sala de balanço”, na qual estamos em um piso sólido e as paredes são ligeiramente balançadas ao nosso redor, sentiremos que estamos caindo em direção a uma parede que se aproxima e nos inclinamos corretivamente para trás para compensar (e as crianças mais novas normalmente cairão) (Lee e Aronson, 1974).
Ilusões multissensoriais não envolvem todas as ilusões de visão. A ilusão de pele de pergaminho descreve um efeito inquietante que o som pode ter sobre o nosso sentido de tacto. Se esfregarmos as nossas mãos juntas e ouvirmos o som que elas emitem através dos auscultadores mas remixadas para enfatizar as altas frequências, as nossas mãos sentir-se-ão secas e escamosas. O mesmo tratamento sónico tem efeitos mais agradáveis na experiência de comer batatas fritas, que são classificadas como mais frescas e estaladiças quando ouvimos mais altas frequências à medida que as mordemos. Estes efeitos surgem porque, ao chegar a uma interpretação de qualquer evento, o nosso sistema perceptual integra evidências de todas as fontes sensoriais disponíveis, bem como se baseia em conhecimentos prévios sobre o que é mais provável. Se o efeito McGurk ou a ilusão de pele de pergaminho parecem surpreendentes, isso se deve principalmente a uma noção enganosa de que nossos sentidos são separados e distintos, ao invés de ricos em experiência. Como outras ilusões cognitivas, é questionável se é justo pensar nesses efeitos multissensoriais como sendo falhas de percepção, quando eles são realmente bons palpites sobre o padrão total de estimulação.
Uma ilusão multissensorial que tem capturado a imaginação de muitos pesquisadores é a ilusão da mão de borracha (Botvinick e Cohen, 1998). Uma pessoa está sentada na frente de uma mão falsa que é acariciada e espetada por um experimentador. A outra mão do experimentador aplica uma série sincronizada de pinceladas e sondas à mão real da pessoa, que está escondida atrás de uma tela de oclusão. A pessoa vê assim um padrão de toques na mão falsa enquanto sente os toques correspondentes. Eles sabem que a mão é falsa, mas não podem escapar à impressão de que ela é de alguma forma uma parte do seu corpo; a coincidência da visão e do tato é muito improvável para ser interpretada de qualquer outra forma. A vivacidade dessa ilusão é bem demonstrada pelas reações defensivas automáticas da pessoa se ela vê a mão ameaçada, por exemplo, por uma faca ou um martelo. Este é apenas um exemplo de uma série de “ilusões de encarnação”, que incluem configurações que podem nos fazer sentir como se estivéssemos no corpo de um manequim, ou de um boneco de brinquedo como Barbie ou Ken, ou que estamos fora do nosso corpo olhando (Petkova e Ehrsson, 2008). Essa pronta remodelação de nosso senso de identidade sugere que mesmo esse aspecto mais pessoal de nossa realidade perceptiva é uma inferência indireta, a melhor tentativa de nosso cérebro de interpretar as evidências disponíveis.
Ilusões de encarnação que dependem da integração da visão e do tato podem ser convincentes, mas normalmente são bastante limitadas porque são passivas. Se a pessoa decide fazer um movimento mas a mão falsa não cumpre, isto contradiz o seu sentido de propriedade e a ilusão está acabada. Seria uma experiência mais convincente e ativa se a pessoa pudesse mover a mão fictícia à vontade, e sentir e manipular os objetos que ela toca. A realidade virtual moderna, com visão panorâmica de alta resolução, som surround e luvas e fatos de feedback tátil, está se movendo em direção a experiências tão imersivas. Um sistema suficientemente avançado deste tipo seria indistinguível de um mundo físico; assim, se a nossa realidade é ou não uma ilusão, uma ilusão suficientemente completa poderia tornar-se a nossa realidade.