Ilusiones cognitivas
La información sensorial es a menudo ambigua, pero la orientación eficiente del comportamiento requiere que lleguemos rápidamente a interpretaciones perceptivas inequívocas. Para ello, complementamos la información sensorial con conocimientos previos y experiencias de situaciones similares. Podemos pensar que este conocimiento previo nos proporciona las «mejores suposiciones» sobre el estado probable del mundo. Esta estrategia nos lleva rápidamente a la interpretación correcta la mayoría de las veces, pero cuando nuestras suposiciones son erróneas, nuestras percepciones serán equivocadas. Las ilusiones cognitivas se explican a menudo en términos de estas suposiciones mal aplicadas. El término «cognitivo» no implica que las suposiciones se hagan conscientemente: suelen estar por debajo del radar de la conciencia, muy arraigadas e incluso inamovibles. Esto explica por qué las ilusiones cognitivas pueden persistir sin disminuir incluso después de que sepamos que nos están engañando. Las ilusiones cognitivas pueden surgir para cualquier modalidad sensorial, y para las percepciones basadas en múltiples modalidades, pero la visión, de nuevo, proporciona abundantes ejemplos.
Algunas sorprendentes ilusiones visuales son el resultado de mecanismos de constancia perceptiva. Estos mecanismos de constancia normalmente nos mantienen en sintonía con las verdaderas propiedades de los objetos, independientemente de los cambios en la estimulación que nos presentan. Un ejemplo convincente es la constancia de la luminosidad, bien ilustrada por la ilusión del tablero de damas de Adelson (Fig. 4A). Podemos ser reacios a aceptar que las baldosas A y B tienen exactamente el mismo tono de gris porque la B nos parece mucho más clara, pero nuestra percepción de la luminosidad de la baldosa está determinada no por la cantidad absoluta de luz que refleja, sino por una estimación de la proporción de luz incidente que refleja. La baldosa B parece estar en la sombra, por lo que vemos una baldosa clara que refleja la mayor parte de su escasa iluminación. La baldosa A parece no estar en la sombra, por lo que vemos una baldosa oscura que refleja relativamente menos de su iluminación más fuerte. Hacemos ajustes similares para el color de la fuente de luz, con el fin de inferir las propiedades de reflectancia de la superficie de los objetos en la escena (constancia de color). Las fresas de la Fig. 4B se representan en tonos grises, pero las vemos rojas porque nos ajustamos automáticamente a la aparente iluminación azul-verde de la imagen. Tales efectos ilustran la asombrosa capacidad del sistema perceptivo para compensar amplias variaciones en las condiciones de iluminación.
Otra constancia perceptiva es la constancia de la forma, que describe nuestra capacidad para ajustarnos a las variaciones de forma y tamaño de las imágenes proyectadas a nuestro ojo cuando vemos un objeto desde diferentes puntos de vista. La proyección óptica de una moneda circular en una mesa delante de ti es una elipse ancha, pero tu percepción compensa la perspectiva escorzada y ves la moneda como un círculo. La constancia de la forma puede producir fuertes ilusiones cuando las imágenes bidimensionales (planas) se interpretan utilizando las suposiciones propias de los objetos sólidos. Los tableros de Shepard de la Fig. 4C son paralelogramos idénticos -uno podría superponerse exactamente al otro-, pero como los interpretamos como objetos sólidos girados de forma diferente en profundidad, nuestra percepción compensa un escorzo de la longitud de una mesa y la anchura de la otra. El resultado es que los tableros de las mesas, objetivamente idénticos, nos parecen radicalmente diferentes, uno largo y estrecho, el otro corto y ancho (Shepard, 1990).
Un aspecto de la constancia de la forma es la constancia del tamaño, que describe la tendencia a aumentar la escala de los objetos más distantes en la percepción. Esto nos permite ver los objetos como relativamente estables en tamaño a pesar de los cambios en la distancia de visión. La imagen óptica de la amiga que se va reduce su tamaño a la mitad a medida que se aleja el doble, pero usted no percibe que se encoge; su percepción de la imagen que se encoge se amplía progresivamente para compensar el aumento de la distancia de visión. Una buena forma de apreciar el poder de este reajuste perceptivo es mirar fijamente a una fuente de luz brillante, como la bombilla de una lámpara, durante uno o dos minutos. Después, una mancha oscura (la posimagen negativa de la luz) parecerá proyectarse sobre cualquier superficie pálida que se mire. El tamaño óptico de esta imagen posterior es constante, y corresponde a la zona de la retina expuesta a la luz intensa, pero su tamaño percibido variará drásticamente con la distancia de la superficie que se mire. La mancha se verá mucho más pequeña en una tarjeta blanca sostenida en la mano que en una pared lejana; incluso se puede ver cómo se encoge y crece a medida que se mueve la tarjeta hacia y fuera de la cara, o se camina hacia y fuera de la pared.
Al igual que con los tableros de Shepard, la constancia del tamaño puede crear fuertes ilusiones cuando interpretamos una imagen plana como si fuera una escena en profundidad. Consideremos la ilusión de Ponzo en la Fig. 4D, en la que la línea superior parece más larga que la línea (idéntica) inferior. Una fuente importante de este efecto puede ser que vemos las líneas laterales convergentes como una proyección de líneas paralelas en el mundo, como las vías del tren que se alejan en la distancia. La línea superior se interpreta como más lejana, por lo que se aumenta la escala perceptiva para compensar. El mismo efecto puede inducirse en imágenes de escenas reales reproduciendo un elemento de la imagen del primer plano a una distancia aparente mayor; la absurda ampliación de las furgonetas blancas distantes en la Fig. 4E nos muestra hasta qué punto nuestra percepción del tamaño se escala normalmente en función de la distancia. Incluso en algunas escenas del mundo real, la mala interpretación de las señales de distancia puede contribuir a las ilusiones de tamaño. Por ejemplo, la luna puede parecer mucho más grande cuando está baja en el horizonte que cuando está alta en el cielo. Esta ilusión celeste ha desconcertado a los humanos durante siglos, y se han propuesto múltiples teorías para explicarla (Ross y Plug, 2002). Una de ellas es que, cuando la luna está en el horizonte, suele haber elementos intermedios, como edificios y árboles, que indican la distancia, por lo que el tamaño percibido aumenta. Otra es que, cuando vemos la luna en lo alto de un cielo sin rasgos distintivos, nuestros ojos pueden enfocar y fijarse en una distancia más corta, por lo que el tamaño percibido disminuye. Sin embargo, aunque podemos informar del tamaño aparente de la luna con facilidad, es posible que seamos menos conscientes de las señales de distancia que la afectan. De hecho, si se les pregunta directamente, las personas suelen juzgar que la luna está más cerca cuando está en el horizonte, tal vez razonando (erróneamente) que si parece más grande entonces debe estar más cerca.
En varias de estas ilusiones, especialmente cuando nos engañan con imágenes, parece un poco injusto decir que estamos realmente equivocados, porque la percepción sería invariablemente exacta en el mundo real. Una baldosa que es gris a la sombra tendría efectivamente un color de superficie claro, una fresa que es gris a la luz azul-verde sería efectivamente una fruta roja, y las mesas de Shepard serían dos muebles de forma muy diferente. Teniendo en cuenta que nuestros sistemas perceptivos se han desarrollado, a través de la evolución y dentro de cada vida, para soportar el compromiso con el mundo real, estas percepciones podrían considerarse éxitos más que fracasos. Estamos optimizados para ver las propiedades de la superficie de los objetos, no las longitudes de onda concretas que se reflejan, y para comprender las formas de los objetos sólidos, no las proyecciones sobre un plano (lo que puede llevar años de entrenamiento artístico). Cuando surgen ilusiones en escenas del mundo real, suele ser porque la escena es muy improbable o simplemente no está diseñada para nuestro sistema. Por ejemplo, nuestros sofisticados mecanismos para juzgar las distancias y los tamaños fallan cuando se aplican a los cuerpos celestes porque las distancias y los tamaños implicados están muy lejos de nuestra experiencia, y porque no importa si los percibimos con precisión o no. Es seguro suponer que nadie ha muerto nunca por haber juzgado mal el tamaño de la luna.
Si estamos diseñados para un compromiso activo con un mundo terrestre de objetos sólidos, esto puede explicar por qué no podemos evitar ver una interpretación de profundidad de una imagen, cuando ésta es posible, aunque sepamos que la imagen es realmente plana. Estamos tan acostumbrados a la perspectiva y al sombreado en el arte, y a las fotografías y vídeos, que es fácil olvidar las notables ilusiones de profundidad que nos proporcionan. Quizás la razón principal por la que las películas en 3D, que añaden profundidad estereoscópica a la experiencia cinematográfica, nunca han cautivado la imaginación, es que ya obtenemos una profundidad tan rica de las películas en 2D. Al verlas, nuestra visión sólo hace lo que es natural (analizar la estructura de profundidad de una escena), pero con un estímulo de naturaleza muy improbable (una representación plana de una escena). Esto reitera el punto más general sobre las ilusiones cognitivas: las suposiciones que hacen nuestros sistemas perceptivos sobre las causas probables de las sensaciones se basan en un mundo familiar de objetos sólidos, que se comportan de forma (mayoritariamente) predecible. Cuando nos enfrentamos a situaciones improbables, en las que estas suposiciones no se cumplen, nuestras mejores suposiciones pueden ser erróneas y se producirán percepciones erróneas ilusorias.
Más allá del plano de la imagen, algunas ilusiones sorprendentes pueden ser inducidas por estructuras tridimensionales improbables que nos invitan a malinterpretar su forma. Adelbert Ames Jr. inventó varias construcciones diabólicamente ingeniosas. La más célebre de ellas es una habitación que parece normalmente cuboide cuando se ve a través de una mirilla en una de las paredes, pero que en realidad no tiene ningún ángulo recto y está geométricamente estirada de modo que una esquina enfrentada está mucho más lejos del ojo que la otra (Fig. 5A). La impresión visual es que las esquinas enfrentadas son equidistantes, por lo que no se produce ningún cambio de tamaño constante cuando vemos a una persona caminar de un lado a otro, y parece crecer y encogerse al hacerlo. Un maestro contemporáneo de la ilusión 3D es el matemático Kokichi Sugihara, que, entre otros objetos extraordinarios, ha construido un conjunto de «pendientes similares a un imán» en las que las pelotas parecen rodar cuesta arriba (Fig. 5B) (Sugihara, 2014). Estas construcciones tan meticulosas ceban nuestras suposiciones sobre la forma probable de los objetos con tanta fuerza que nos vemos obligados a relajar nuestra intuición de que las pelotas no ruedan cuesta arriba o de que las personas no cambian de tamaño por arte de magia. Estos efectos funcionan mejor cuando se ven con un solo ojo -o con una cámara- desde una posición fija, de modo que la imagen corresponde exactamente a la intención del ilusionista y no se dispone de señales de profundidad contradictorias procedentes de la visión binocular o del cambio de punto de vista. En cuanto se permite al espectador explorar la escena moviéndose a su alrededor, se revela la verdadera estructura de profundidad y se rompe el hechizo. Por lo tanto, aunque sean tridimensionales en su construcción, estas ilusiones siguen derivando en última instancia sus efectos de las imágenes pictóricas planas que proyectan.
Más tolerante con las perspectivas múltiples, y también más fácil de montar, es la ilusión de la máscara hueca. Una máscara vista desde atrás no parece hueca en absoluto, sino convexa (curvada hacia fuera) (Fig. 5C). Esta inversión ilusoria de la profundidad es bastante robusta, especialmente si se ve con un ojo cerrado, y con la máscara hueca iluminada desde abajo para que las sombras y las luces caigan como lo harían en una máscara convexa iluminada convencionalmente desde arriba. Incluso con los dos ojos abiertos, uno puede acercarse a una máscara hueca hasta un metro y medio antes de que la visión binocular disipe la ilusión. La explicación habitual que se da es que tenemos fuertes expectativas, basadas en la experiencia previa, de que las caras son convexas, por lo que nos aferramos a esta interpretación. Pero las expectativas son sólo una parte de la historia; también es necesario que las señales sensoriales disponibles dejen espacio para la ambigüedad. Por lo tanto, la ilusión aumenta cuando se reducen las señales de profundidad binoculares (cerrando un ojo o mirando desde lejos) o se añaden señales engañosas (cambiando la dirección de la luz). Si las señales de profundidad son suficientemente ambiguas, pueden obtenerse inversiones ilusorias para muchas otras formas, como moldes de gelatina huecos o modelos de alambre de formas geométricas (por ejemplo, un cubo de alambre). No obstante, el efecto es más robusto para los objetos altamente familiares, como las caras verticales, de las que esperamos fuertemente que sean convexas (Hill y Johnston, 2007). Cuanto más fuertes sean nuestras expectativas previas, más tenderán a anular la evidencia sensorial, y viceversa.
Así como nuestra percepción surge de un proceso de integración de las expectativas previas con la evidencia sensorial, también debemos integrar la evidencia de múltiples canales sensoriales. La salsa que burbujea en tu sartén tiene color y textura, emite suaves sonidos de estallido, ofrece resistencia física al removerla y (con suerte) huele delicioso. Estas facetas sensoriales se combinan para crear una experiencia perceptiva unificada de la cocina, y son más interdependientes de lo que se cree. Esta interdependencia puede demostrarse creando desajustes artificiales entre los canales sensoriales. En tales circunstancias, la información de la visión tiende a dominar los demás sentidos. El ventriloquismo se conoce como «lanzar la voz» porque el ventrílocuo hace que su propia voz parezca provenir de un lugar diferente, pero el truco está principalmente en el control preciso de lo que ve el público. La ventrílocua oculta sus propios movimientos al hablar, mientras mueve una boca ficticia junto con el discurso para sugerir una fuente alternativa, que mira como si fuera una persona la que habla. Incluso sin un engaño tan elaborado, localizamos automáticamente las voces de las películas en los actores, aunque el sistema de sonido pueda estar a varios metros de la pantalla.
La información visual puede hacer algo más que cambiar la ubicación percibida de una voz, puede remodelar los sonidos del habla que escuchamos. En el efecto McGurk, oímos una grabación de audio de una persona repitiendo una sílaba, «ba-ba», acompañada de un vídeo sincronizado de una persona pronunciando una sílaba con una consonante inicial diferente (por ejemplo, «da-da», «va-va»).3 La sílaba que oímos depende de los movimientos del habla que vemos, y nuestra percepción auditiva cambia de «ba» a «da» a «va» cuando la misma grabación de audio se empareja con vídeos diferentes. La visión también puede alterar nuestras impresiones gustativas, por eso el aspecto de un plato es tan importante para la experiencia de comer. Se dice que las verduras saben más frescas si tienen colores más vivos, y que el zumo de manzana sabe a frambuesa si se le añade un colorante rojo sin sabor. El mismo colorante rojo, cuando se añade al vino blanco, puede engañar a los catadores expertos para que informen de las notas de sabor típicas de los tintos (Spence, 2010). Del mismo modo, nuestro sentido del equilibrio puede verse literalmente influenciado por la visión: si nos colocan dentro de una «habitación oscilante», en la que estamos de pie sobre un suelo sólido y las paredes se balancean ligeramente a nuestro alrededor, sentiremos que estamos cayendo hacia una pared que se aproxima y nos inclinaremos correctivamente hacia atrás para compensar (y los niños más pequeños normalmente se caerán) (Lee y Aronson, 1974).
Las ilusiones multisensoriales no implican todas la visión. La ilusión de la piel de pergamino describe un efecto inquietante que el sonido puede tener sobre nuestro sentido del tacto. Si nos frotamos las manos y escuchamos el sonido que emiten a través de unos auriculares pero remezclado para enfatizar las frecuencias altas, nuestras manos se sentirán secas y escamadas. El mismo tratamiento sonoro tiene efectos más agradables en la experiencia de comer patatas fritas, que se califican como más frescas y crujientes cuando oímos más frecuencias altas al morderlas. Estos efectos surgen porque, al llegar a una interpretación de cualquier acontecimiento, nuestro sistema perceptivo integra la evidencia de todas las fuentes sensoriales disponibles, además de recurrir al conocimiento previo sobre lo que es más probable. Si el efecto McGurk o la ilusión de la piel de pergamino parecen sorprendentes, se debe principalmente a la idea errónea de que nuestros sentidos están separados y son distintos, en lugar de estar ricamente entremezclados en la experiencia. Al igual que otras ilusiones cognitivas, cabe preguntarse si es justo considerar estos efectos multisensoriales como fallos de la percepción, cuando en realidad son conjeturas bastante buenas sobre el patrón total de estimulación.
Una ilusión multisensorial que ha captado la imaginación de muchos investigadores es la ilusión de la mano de goma (Botvinick y Cohen, 1998). Una persona está sentada frente a una mano ficticia que es acariciada y pinchada por un experimentador. La otra mano del experimentador aplica una serie sincronizada de caricias y empujones a la mano real de la persona, que está oculta tras una pantalla oclusiva. De este modo, la persona ve un patrón de toques en la mano ficticia mientras siente los toques correspondientes. Sabe que la mano es falsa, pero no puede evitar la impresión de que, de algún modo, forma parte de su cuerpo; la coincidencia de la vista y el tacto es demasiado improbable para ser interpretada de otro modo. La vivacidad de esta ilusión queda bien demostrada por las reacciones defensivas automáticas de la persona si ve la mano amenazada, por ejemplo, por un cuchillo o un martillo. Este es sólo un ejemplo de una serie de «ilusiones de personificación», que incluyen montajes que pueden hacernos sentir que estamos en el cuerpo de un maniquí, o de un muñeco de juguete como Barbie o Ken, o que estamos de pie fuera de nuestro cuerpo mirando (Petkova y Ehrsson, 2008). Esta remodelación de nuestro sentido del yo sugiere que incluso este aspecto más personal de nuestra realidad perceptiva es una inferencia indirecta, el mejor intento de nuestro cerebro de interpretar las pruebas disponibles.
Las ilusiones de sensaciones que dependen de la integración de la visión y el tacto pueden ser convincentes, pero suelen ser bastante limitadas porque son pasivas. Si la persona decide hacer un movimiento pero la mano ficticia no lo cumple, esto contradice su sentido de propiedad y la ilusión se acaba. La experiencia sería más convincente y activa si la persona pudiera mover la mano del maniquí a voluntad, y sentir y manipular los objetos que toca. La realidad virtual moderna, con visión panorámica de alta resolución, sonido envolvente y guantes y trajes con retroalimentación táctil, avanza hacia este tipo de experiencias inmersivas. Un sistema suficientemente avanzado de este tipo sería indistinguible de un mundo físico; así que, sea o no nuestra realidad una ilusión, una ilusión suficientemente completa podría convertirse en nuestra realidad.