Illusions cognitives
Les informations sensorielles sont souvent ambiguës mais l’orientation efficace du comportement exige que nous arrivions rapidement à des interprétations perceptives non ambiguës. Pour ce faire, nous complétons les informations sensorielles par des connaissances antérieures et l’expérience de situations similaires. Nous pouvons considérer que ces connaissances antérieures nous donnent les meilleures hypothèses sur l’état probable du monde. Cette stratégie nous permet d’arriver rapidement à la bonne interprétation la plupart du temps, mais lorsque nos hypothèses sont fausses, nos perceptions sont erronées. Les illusions cognitives sont souvent expliquées en termes d’hypothèses mal appliquées. Le terme « cognitif » n’implique pas que les hypothèses soient faites consciemment : elles sont généralement sous le radar de la conscience, profondément enracinées, voire inébranlables. Cela explique pourquoi les illusions cognitives peuvent persister sans faiblir, même après que nous ayons compris que nous avons été trompés. Les illusions cognitives peuvent survenir pour toute modalité sensorielle, et pour des perceptions basées sur des modalités multiples, mais la vision fournit à nouveau une abondance d’exemples.
Certaines illusions visuelles frappantes résultent de mécanismes de constance perceptive. Ces mécanismes de constance nous permettent normalement de rester en accord avec les véritables propriétés des objets, indépendamment des changements dans la stimulation qu’ils nous présentent. La constance de la luminosité, bien illustrée par l’illusion du damier d’Adelson (figure 4A), en est un exemple convaincant. Nous pouvons être réticents à l’idée que les carreaux A et B sont exactement de la même nuance de gris parce que B nous semble beaucoup plus clair, mais notre perception de la luminosité du carreau est déterminée non pas par la quantité absolue de lumière qu’il reflète, mais par une estimation de la proportion de la lumière incidente qu’il reflète. Le carreau B semble être dans l’ombre et nous voyons donc un carreau clair qui reflète la majorité de son faible éclairage. Le carreau A ne semble pas être dans l’ombre et nous voyons donc un carreau sombre reflétant relativement moins de son éclairage plus fort. Nous effectuons des ajustements similaires pour la couleur de la source lumineuse, afin de déduire les propriétés de réflectance de la surface des objets de la scène (constance de la couleur). Les fraises de la figure 4B sont rendues en nuances de gris, mais nous les voyons rouges parce que nous nous ajustons automatiquement à l’éclairage bleu-vert apparent de l’image. De tels effets illustrent l’étonnante capacité du système perceptif à compenser les grandes variations des conditions d’éclairage.
Une autre constance perceptive est la constance de forme, qui décrit notre capacité à nous ajuster aux variations de forme et de taille des images projetées à notre œil lorsque nous voyons un objet depuis différents points de vue. La projection optique d’une pièce de monnaie circulaire sur une table devant vous est une large ellipse, mais votre perception compense la perspective raccourcie et vous voyez la pièce comme un cercle. La constance de la forme peut produire de fortes illusions lorsque des images bidimensionnelles (plates) sont interprétées en utilisant des hypothèses appropriées pour des objets solides. Les plateaux de table de Shepard de la figure 4C sont des parallélogrammes identiques – l’un pourrait être superposé exactement à l’autre – mais comme nous les interprétons comme des objets solides tournés différemment en profondeur, notre perception compense un raccourcissement de la longueur d’une table et de la largeur de l’autre. Le résultat est que les plateaux de table objectivement identiques nous apparaissent radicalement différents, l’un long et étroit, l’autre court et large (Shepard, 1990).
Un aspect de la constance de forme est la constance de taille, qui décrit la tendance des objets plus éloignés à être mis à l’échelle dans la perception. Cela nous permet de voir les objets comme étant relativement stables en taille malgré les changements de distance de vision. L’image optique de votre amie qui s’en va diminue de moitié lorsqu’elle est deux fois plus éloignée, mais vous ne la percevez pas comme rétrécie ; votre perception de son image rétrécie est progressivement mise à l’échelle pour compenser l’augmentation de la distance d’observation. Une bonne façon d’apprécier la puissance de ce changement d’échelle perceptive est de fixer une source de lumière vive, comme l’ampoule d’une lampe, pendant une minute ou deux. Ensuite, une tache sombre (la rémanence négative de la lumière) semblera être projetée sur toute surface claire que vous regardez. La taille optique de cette image rémanente est constante, correspondant à la zone de la rétine exposée à la lumière forte, mais sa taille perçue varie considérablement en fonction de la distance de la surface que vous regardez. La tache paraîtra beaucoup plus petite sur une carte blanche tenue dans votre main que sur un mur éloigné ; vous pouvez même la voir rétrécir et grandir lorsque vous rapprochez et éloignez la carte de votre visage, ou lorsque vous marchez en vous approchant et en vous éloignant du mur.
Comme pour les plateaux de Shepard, la constance de la taille peut créer de fortes illusions lorsque nous interprétons une image plate comme s’il s’agissait d’une scène en profondeur. Considérez l’illusion de Ponzo dans la figure 4D, dans laquelle la ligne supérieure semble plus longue que la ligne (identique) en dessous. Cet effet peut s’expliquer en grande partie par le fait que nous considérons les lignes latérales convergentes comme une projection de lignes parallèles dans le monde, comme des rails de train qui s’éloignent au loin. La ligne supérieure est donc interprétée comme étant plus éloignée et sa taille est augmentée pour compenser. Le même effet peut être induit dans des images de scènes réelles en reproduisant un élément d’image du premier plan à une distance apparente plus grande ; l’agrandissement absurde des camionnettes blanches distantes de la figure 4E nous montre à quel point notre perception de la taille est normalement mise à l’échelle par la distance. Même dans certaines scènes du monde réel, la mauvaise interprétation des indices de distance peut contribuer aux illusions de taille. Par exemple, la lune peut sembler beaucoup plus grande lorsqu’elle est basse sur l’horizon que lorsqu’elle est haute dans le ciel. Cette illusion céleste a intrigué les humains pendant des siècles et de nombreuses théories ont été proposées pour l’expliquer (Ross et Plug, 2002). L’une des suggestions est que, lorsque la lune est à l’horizon, il y a généralement des éléments intermédiaires tels que des bâtiments et des arbres pour indiquer la distance, de sorte que la taille perçue augmente. Une autre suggestion est que, lorsque nous voyons la lune en hauteur dans un ciel sans caractéristiques, nos yeux peuvent en fait se concentrer et se fixer à une distance plus courte, de sorte que la taille perçue diminue. Cependant, alors que nous pouvons facilement indiquer la taille apparente de la lune, nous sommes peut-être moins conscients des indices de distance qui l’affectent. En effet, si on leur pose la question directement, les gens jugent généralement que la lune est plus proche lorsqu’elle est à l’horizon, raisonnant peut-être (à tort) que si elle semble plus grande, alors elle doit être plus proche.
Dans plusieurs de ces illusions, notamment lorsque nous sommes trompés par des images, il semble un peu injuste de dire que nous nous trompons vraiment, car la perception serait invariablement exacte dans le monde réel. Un carreau gris dans l’ombre aurait en effet une surface de couleur claire, une fraise grise dans la lumière bleu-vert serait en fait un fruit rouge, et les tables de Shepard seraient deux meubles de forme très différente. Si l’on considère que nos systèmes perceptifs se sont développés, au cours de l’évolution et au cours de chaque vie, pour soutenir l’engagement avec le monde réel, ces perceptions pourraient être considérées comme des succès plutôt que des échecs. Nous sommes optimisés pour voir les propriétés de la surface des objets et non les longueurs d’onde particulières qui sont réfléchies, et pour comprendre les formes des objets solides et non les projections sur un plan plat (ce qui peut demander des années d’entraînement artistique). Lorsque des illusions apparaissent dans des scènes du monde réel, c’est généralement parce que la scène est très improbable ou simplement parce qu’elle n’a pas été conçue pour notre système. Par exemple, nos mécanismes sophistiqués d’évaluation des distances et des tailles échouent lorsqu’ils sont appliqués à des corps célestes, car les distances et les tailles en question sont très éloignées de notre expérience, et parce qu’il importe peu que nous les percevions correctement ou non. On peut supposer que personne n’est jamais mort pour avoir mal évalué la taille de la lune.
Si nous sommes conçus pour un engagement actif avec un monde terrestre d’objets solides, cela peut expliquer pourquoi nous ne pouvons pas éviter de voir une interprétation de la profondeur d’une image, lorsqu’elle est possible, même si nous savons que l’image est en fait plate. Nous sommes tellement habitués à la perspective et à l’ombrage dans l’art, ainsi qu’aux photographies et aux vidéos, qu’il est facile d’oublier les remarquables illusions de profondeur qu’elles nous donnent. La principale raison pour laquelle les films en 3D, qui ajoutent une profondeur stéréoscopique à l’expérience cinématographique, n’ont jamais frappé l’imagination, est peut-être que les films en 2D nous offrent déjà une profondeur si riche. Lorsque nous les regardons, notre vision ne fait que faire ce qui lui vient naturellement (analyser la structure de profondeur d’une scène) mais avec un stimulus dont la nature est très improbable (une représentation plate d’une scène). Cela réitère le point plus général sur les illusions cognitives : les hypothèses que nos systèmes perceptifs formulent sur les causes probables des sensations sont basées sur un monde familier d’objets solides, qui se comportent de manière (généralement) prévisible. Lorsque nous sommes confrontés à des situations improbables, où ces hypothèses ne tiennent pas, alors nos meilleures suppositions peuvent être fausses et des perceptions illusoires erronées s’ensuivent.
Au delà du plan de l’image, certaines illusions étonnantes peuvent être induites par des structures tridimensionnelles improbables qui nous invitent à mal interpréter leur forme. Plusieurs constructions diaboliquement astucieuses ont été inventées par Adelbert Ames Jr. La plus célèbre d’entre elles est une pièce qui semble normalement cuboïde lorsqu’elle est vue à travers un judas dans un mur, mais qui en fait n’a aucun angle droit et est géométriquement étirée de sorte qu’un coin opposé est beaucoup plus éloigné de l’œil que l’autre (Fig. 5A). L’impression visuelle est que les coins opposés sont équidistants, de sorte qu’il n’y a pas de changement d’échelle de taille lorsque nous voyons une personne marcher d’un côté à l’autre, et elle semble grandir et rétrécir pendant qu’elle le fait. Un maître contemporain de l’illusion 3D est le mathématicien Kokichi Sugihara qui, parmi d’autres objets extraordinaires, a construit un ensemble de « pentes aimantées » sur lesquelles des balles semblent rouler en montant (figure 5B) (Sugihara, 2014). Des constructions aussi méticuleuses amorcent si fortement nos hypothèses sur la forme probable des objets que nous sommes obligés de relâcher notre intuition selon laquelle les balles ne roulent pas vers le haut ou que les personnes ne changent pas de taille par magie. Ces effets fonctionnent mieux lorsqu’ils sont observés d’un seul œil – ou avec une caméra – depuis une position fixe, de sorte que l’image correspond exactement à l’intention de l’illusionniste et qu’aucun indice de profondeur contradictoire ne peut être obtenu par la vision binoculaire ou par un changement de point de vue. Dès que le spectateur est autorisé à explorer la scène en se déplaçant autour d’elle, la véritable structure de profondeur est révélée et le charme est rompu. Ainsi, bien que de construction tridimensionnelle, ces illusions tirent toujours en fin de compte leurs effets des images picturales plates qu’elles projettent.
Plus tolérante aux perspectives multiples, et aussi plus facile à mettre en place, est l’illusion du masque creux. Un masque vu de dos ne semble pas du tout creux, mais convexe (courbé vers l’extérieur) (figure 5C). Cette inversion illusoire de la profondeur est assez robuste, surtout si l’on regarde avec un œil fermé, et avec le masque creux éclairé par le bas de sorte que les ombres et les lumières tombent comme elles le feraient sur un masque convexe éclairé conventionnellement par le haut. Même avec les deux yeux ouverts, on peut s’approcher d’un masque creux à environ un mètre et demi avant que la vision binoculaire ne dissipe l’illusion. L’explication habituelle est que nous nous attendons fortement, sur la base de notre expérience antérieure, à ce que les visages soient convexes, et nous nous accrochons donc à cette interprétation. Mais les attentes ne sont qu’une partie de l’histoire ; il est également nécessaire que les indices sensoriels disponibles laissent place à l’ambiguïté. Ainsi, l’illusion est renforcée lorsque les indices de profondeur binoculaires sont réduits (en fermant un œil ou en regardant de loin) ou lorsque des indices trompeurs sont ajoutés (en changeant la direction de l’éclairage). Si les indices de profondeur sont suffisamment ambigus, des inversions illusoires peuvent être obtenues pour de nombreuses autres formes, telles que des moules creux en gelée ou des modèles en fil de fer de formes géométriques (par exemple, un cube en fil de fer). Néanmoins, l’effet est plus robuste pour les objets très familiers, comme les visages droits, dont nous nous attendons fortement à ce qu’ils soient convexes (Hill et Johnston, 2007). Plus nos attentes préalables sont fortes, plus elles auront tendance à l’emporter sur les preuves sensorielles, et vice versa.
De même que notre perception découle d’un processus d’intégration des attentes préalables aux preuves sensorielles, nous devons intégrer des preuves provenant de plusieurs canaux sensoriels. La sauce qui bouillonne dans votre casserole a une couleur et une texture, émet des sons doux et pétillants, offre une résistance physique lorsqu’on la remue et (espérons-le) sent bon. Ces facettes sensorielles se combinent pour créer une expérience perceptive unifiée de la cuisine, et sont plus interdépendantes que vous ne le pensez. Cette interdépendance peut être démontrée en créant des décalages artificiels entre les canaux sensoriels. Dans de telles circonstances, les informations provenant de la vision ont tendance à dominer les autres sens. La ventriloquie est connue sous le nom de « lancer sa voix » parce que le ventriloque fait en sorte que sa propre voix semble provenir d’un autre endroit, mais l’astuce réside principalement dans le contrôle précis de ce que le public voit. Le ventriloque cache ses propres mouvements de parole, tout en déplaçant une bouche factice en même temps que le discours pour suggérer une autre source, qu’il regarde comme si c’était une personne qui parlait. Même sans une tromperie aussi élaborée, nous localisons automatiquement les voix dans les films aux acteurs, même si la sonorisation peut se trouver à plusieurs mètres de l’écran.
Les informations visuelles peuvent faire plus que déplacer l’emplacement perçu d’une voix, elles peuvent remodeler les sons vocaux que nous entendons. Dans l’effet McGurk, nous entendons l’enregistrement audio d’une personne répétant une syllabe, » ba-ba « , accompagné d’une vidéo synchronisée d’une personne prononçant une syllabe avec une consonne initiale différente (par exemple, » da-da « , » va-va « ).3 La syllabe que nous entendons dépend des mouvements de la parole que nous voyons, et notre perception auditive passe de » ba » à » da » puis à » va » lorsque le même enregistrement audio est associé à des vidéos différentes. La vision peut également modifier nos impressions gustatives, c’est pourquoi l’aspect d’un plat fait partie intégrante de l’expérience culinaire. On dit que les légumes ont un goût plus frais s’ils sont colorés de façon plus vive, et que le jus de pomme a un goût de framboise si on y ajoute un colorant rouge insipide. Le même colorant rouge, lorsqu’il est ajouté à du vin blanc, peut tromper les dégustateurs experts en leur faisant croire à des notes de goût typiques des rouges (Spence, 2010). De même, notre sens de l’équilibre peut littéralement être influencé par la vision : si nous sommes placés à l’intérieur d’une » salle de balançoire « , dans laquelle nous nous tenons sur un sol solide et les murs sont légèrement balancés autour de nous, nous aurons l’impression de tomber vers un mur qui s’approche et nous nous pencherons de manière corrective en arrière pour compenser (et les plus jeunes enfants tomberont typiquement) (Lee et Aronson, 1974).
Les illusions multisensorielles n’impliquent pas toutes la vision. L’illusion de la peau de parchemin décrit un effet inquiétant que le son peut avoir sur notre sens du toucher. Si nous frottons nos mains l’une contre l’autre et que nous entendons le son qu’elles produisent relayé par un casque mais remixé pour accentuer les hautes fréquences, nos mains seront sèches et écaillées. Le même traitement sonore a des effets plus agréables sur l’expérience de manger des chips, qui sont jugées plus fraîches et plus croustillantes lorsque nous entendons davantage de hautes fréquences lorsque nous les mordons. Ces effets sont dus au fait que, pour interpréter un événement, notre système perceptif intègre des preuves provenant de toutes les sources sensorielles disponibles et fait appel à des connaissances préalables sur ce qui est le plus probable. Si l’effet McGurk ou l’illusion de la peau de parchemin semblent surprenants, c’est principalement en raison d’une notion trompeuse selon laquelle nos sens sont séparés et distincts plutôt que richement entremêlés dans l’expérience. Comme d’autres illusions cognitives, on peut se demander s’il est juste de considérer ces effets multisensoriels comme des échecs de perception, alors qu’ils sont en réalité d’assez bonnes suppositions sur le schéma total de la stimulation.
Une illusion multisensorielle qui a captivé l’imagination de nombreux chercheurs est l’illusion de la main en caoutchouc (Botvinick et Cohen, 1998). Une personne est assise en face d’une main factice qui est caressée et poussée par un expérimentateur. L’autre main de l’expérimentateur applique une série synchronisée de caresses et de poussées sur la vraie main de la personne, qui est cachée derrière un écran d’occultation. La personne voit ainsi un schéma de touches sur la main factice tout en ressentant les touches correspondantes. Elle sait que la main est fausse, mais elle ne peut échapper à l’impression qu’elle fait en quelque sorte partie de son corps ; la coïncidence entre la vue et le toucher est trop improbable pour être interprétée autrement. La vivacité de cette illusion est bien démontrée par les réactions défensives automatiques de la personne si elle voit la main menacée, par exemple par un couteau ou un marteau. Ce n’est là qu’un exemple d’une série d' »illusions d’incarnation », qui comprennent des montages nous donnant l’impression d’être dans le corps d’un mannequin ou d’une poupée de jeu comme Barbie ou Ken, ou encore de nous tenir à l’extérieur de notre corps en train de regarder (Petkova et Ehrsson, 2008). Ce remodelage prêt de notre sens du soi suggère que même cet aspect le plus personnel de notre réalité perceptive est une inférence indirecte, la meilleure tentative de notre cerveau pour interpréter les preuves disponibles.
Les illusions d’embodiment qui dépendent de l’intégration de la vision et du toucher peuvent être convaincantes, mais sont généralement assez limitées parce qu’elles sont passives. Si la personne décide de faire un mouvement mais que la main factice ne s’exécute pas, cela contredit son sentiment de propriété et l’illusion est terminée. L’expérience serait plus captivante et plus active si la personne pouvait déplacer la main factice à volonté, et sentir et manipuler les objets qu’elle touche. La réalité virtuelle moderne, avec sa vision panoramique haute résolution, son son surround et ses gants et combinaisons à retour tactile, s’oriente vers de telles expériences immersives. Un système suffisamment avancé de ce type serait indiscernable d’un monde physique ; ainsi, que notre réalité soit ou non une illusion, une illusion suffisamment complète pourrait devenir notre réalité.