McGurk Effect

Cognitive Illusions

感覚情報はしばしば曖昧だが、行動を効率的に導くためには、曖昧でない知覚解釈に素早く到達することが必要である。 そのために、私たちは感覚情報を事前の知識や類似した状況での経験で補う。 この予備知識は、世界の状況について「最善の推測」を与えてくれるものと考えることができる。 この戦略により、ほとんどの場合、正しい解釈を得ることができますが、前提が間違っていた場合、私たちの知覚は間違ってしまうことになります。 認知的錯覚は、このような思い込みの誤用という観点から説明されることが多い。 認知的」という言葉は、思い込みが意識的になされることを意味しない。一般に、思い込みは意識のレーダーより下にあり、深く根付いていて、揺るぎないものでさえある。 このため、錯覚は、騙されていることが分かっても、衰えることなく続くことがある。 9658>

視覚の錯覚の中には、知覚の恒常性メカニズムに起因するものがある。 これらの不変性メカニズムは、通常、対象物が私たちに与える刺激の変化にかかわらず、対象物の真の性質に同調し続ける。 その代表例が明るさの恒常性であり、エーデルソンのチェッカーボード錯視(図4A)によく表れている。 私たちは、タイルAとBが全く同じ灰色であることを認めたくないかもしれないが、タイルの明るさの知覚は、タイルが反射する光の絶対量ではなく、入射光のうちどの程度の割合を反射するかという推定によって決まるのである。 タイルBは影になっているように見えるので、その薄暗い照明の大部分を反射して明るいタイルに見える。 タイルAは影がないように見えるので、強い光を反射して暗いタイルが相対的に少なく見える。 光源の色についても同様の調整を行い、シーン内の物体の表面反射特性を推測する(色の恒常性)。 図4Bのイチゴは灰色で描かれているが、私たちはイチゴを赤に見ている。これは、青と緑の照明があるように見えるため、自動的に調整されているのである。 このような効果は、照明条件の大きな変化に対応する知覚システムの驚くべき能力を示している。 知覚の恒常性から生じる錯視。 (A)明るさの恒常性を示すチェッカーボード錯視(Edward H. Adelson作)。 AのタイルとBのタイルは同じ灰色であるが、AはBよりもずっと暗く見える。 658> と https://michaelbach.de/ot/lum-adelsonCheckShadow を見てください。 (B)色の恒常性を示す灰色のイチゴ(作者:北岡明佳)。 全体がグレーで描かれているが、イチゴは赤く見える。 (C) ロジャー・N・シェパード作、形状の恒常性を示す「Turning the tables」。 2つのテーブルの天板は全く違う形に見えるが、一方をもう一方の上に正確に重ねることができる(https://michaelbach.de/ot/sze-ShepardTablesを参照)。 (D) 大きさの恒常性のポンゾー錯視。 上の水平線は下の水平線より長く見えるが、同じ長さである。 (E) リチャード・ワイズマン氏によるポンゾー錯視の変形。 9658>

もう一つの知覚の恒常性は形の恒常性で、これは、ある物体を異なる視点から見たときに、目に映る像の形や大きさが変化しても、それを調整する能力のことである。 例えば、テーブルの上に置かれた円形のコインは、広い楕円形をしているが、遠近感が補正され、円形に見える。 このように、2次元(平面)の絵を、立体に適した仮定で解釈すると、形状の恒常性によって強い錯覚が生じることがある。 図4Cのシェパードのテーブルトップは同じ平行四辺形であり、もう一方のテーブルの上に正確に重ねることができる。しかし、我々はこれらを奥行き方向に回転した異なる立体として解釈するので、一方のテーブルの長さともう一方のテーブルの幅を手前に縮めて知覚することになる。 その結果、客観的には同じテーブルトップが、一方は細長く、他方は短く広く、根本的に異なって見えるのです(Shepard, 1990)。

形の恒常性の1つの側面はサイズの恒常性で、これは知覚においてより遠い対象がスケールアップされる傾向を表します。 これにより、見る距離が変わっても、物体の大きさが比較的安定しているように見えるのである。 例えば、あなたの友人から2倍の距離を離すと、その友人は半分の大きさになるが、あなたは彼女が小さくなったとは感じない。 この知覚的な再スケーリングの威力を理解する良い方法の一つは、ランプの電球のような明るい光源を1〜2分間見つめることです。 すると、明るい面に暗い塊(光の負の残像)が投影されたように見えるはずです。 この残像の光学的な大きさは、強い光を受けた網膜のパッチに対応して一定ですが、その大きさは、見る面の距離によって大きく変化します。 シェパードのテーブルトップと同様に、平らな絵を奥行きのある場面であるかのように解釈すると、大きさが一定であるために強い錯覚が生じることがあります。 図4Dのポンゾ錯視は、上の線が下の線(同じ線)よりも長く見えるものである。 この錯視の大きな原因は、収束していく側線を、線路が遠ざかるように平行に走る世界の投影として見ていることにあると思われる。 そのため、上の線はより遠くにあると解釈され、それを補うために知覚的に拡大される。 図4Eの遠くの白いバンの不条理な拡大は、私たちの知覚が通常距離によってどの程度拡大されるかを示しているのです。 現実の光景でも、距離の手がかりを誤って解釈することで大きさの錯覚が生じることがある。 例えば、月は地平線上にあるときは、空高くあるときよりもずっと大きく見えることがあります。 この天体の錯覚は何世紀にもわたって人類を困惑させており、これを説明するために複数の理論が提唱されている(Ross and Plug, 2002)。 1つは、月が地平線上にあるとき、通常は建物や木などの距離を示すものが介在しているため、知覚される大きさが大きくなるというものである。 もう一つは、特徴のない空の高いところにある月を見るとき、私たちの目は実際にはより短い距離に焦点を合わせて固定するため、知覚される大きさが減少するというものである。 しかし、私たちは月の見かけの大きさを簡単に報告できる反面、それに影響を与える距離の手がかりをあまり意識していないのかもしれません。 9658>

これらの錯覚のうち、特に写真に騙された場合、現実世界では必ずと言っていいほど正確な知覚が得られるため、本当に勘違いしていると言うには少し不公平な気がします。 日陰で灰色のタイルは確かに表面の色が明るいし、青緑色の光の中で灰色のイチゴは確かに赤い果物であり、シェパードのテーブルは全く形の異なる2つの家具である。 私たちの知覚システムは、進化の過程で、現実世界との関わりをサポートするために、それぞれの人生の中で発展してきたことを考えると、これらの知覚は失敗ではなく、むしろ成功と言えるかもしれません。 私たちは、反射する特定の波長ではなく物体の表面特性を見るように、また、平面への投影ではなく立体物の形状を理解するように最適化されている(これには何年もの芸術的訓練が必要である)。 現実のシーンで錯覚が起こるのは、そのシーンが非常に起こりにくいか、私たちのシステムが想定していないものである場合がほとんどです。 例えば、距離や大きさを判断するための高度なメカニズムが、天体に適用されると失敗するのは、その距離や大きさが我々の経験の範囲外であり、それを正確に知覚するかどうかは問題でないからである。 9658>

私たちが固体の地上世界と積極的に関わるように設計されているとすれば、絵が実際には平面であることを知っていても、絵の奥行き解釈が可能であれば、それを見ないわけにはいかないのはこのためかもしれない。 私たちは、美術品や写真やビデオにおける遠近法や陰影法に慣れきっているので、それらが私たちに与える驚くべき奥行きの錯覚を忘れがちである。 おそらく、映画体験に立体的な奥行きを与える3D映画が想像力をかきたてない大きな理由は、私たちがすでに2Dの映画から豊かな奥行きを得ているからでしょう。 2D映画を見るとき、私たちの視覚は、自然に起こること(シーンの奥行き構造を分析すること)を、本来は非常にあり得ない刺激(シーンの平面表現)に対して行っているだけなのです。 このことは、認知的錯覚に関するより一般的な指摘を繰り返す。知覚システムが感覚の原因の可能性について行う仮定は、(ほとんど)予測可能な方法で動作する固体物体という慣れ親しんだ世界に基づいているのである。

画面の外では、ありそうもない三次元構造によって驚くべき錯覚が引き起こされ、その形状の誤解を誘うことがある。 最も有名なものは、壁の一面に開けられた覗き穴から見ると普通の立方体に見えるが、実際には直角が全くなく、一方の角が他方から大きく離れているように幾何学的に引き伸ばされた部屋である(図5A)。 視覚的な印象としては、向かい合った角が等距離にあるように見えるので、人が一方から他方へ歩くのを見ても大きさの不変性のリスケーリングは起こらず、その間に伸びたり縮んだりしているように見えるのである。 現代の立体錯視の巨匠といえば、数学者の杉原幸吉である。彼は、ボールが坂を転がるように見える「磁石のような坂道」のセットを構築した(図5B)(杉原、2014年)。 このような綿密な構築は、物体の形状に関する私たちの思い込みを強くし、ボールが坂道を転がることはないとか、人が魔法のように大きさを変えることはないといった直感を緩和することを余儀なくされるのである。 このような効果は、片目で、あるいはカメラで固定された位置から見たときに、最も効果的である。 そして、鑑賞者がその場を動き回ることによって、真の奥行き構造が明らかになり、呪縛が解かれるのである。 このように、3次元的な構造でありながら、これらの錯視は最終的には平面の絵画的なイメージを投影することで効果を得ているのです。 (A)エジンバラのカメラ・オブスキュラと幻影の世界のエイムズの部屋。 (B)杉原幸吉が制作した磁石のような斜面。錯視効果の理想的なビューと、構造を明らかにする側面図を示す。 https://www.youtube.com/watch?v=hAXm0dIuyugをご覧いただくと、その効果の全貌がおわかりいただけると思います。 その他のデモンストレーションはhttp://www.isc.meiji.ac.jp/∼kokichis/impossiblemotions/impossiblemotionseをご覧ください。 (C)エジンバラのカメラ・オブスキュラとワールド・オブ・イリュージョンでの中空マスクの展示物を横から見たものです。 仮面が凸になり、手前に傾いているように見えることに注意してください。 ダイナミックなデモは https://michaelbach.de/ot/fcs-hollowFace.

多視点に強く、セットアップも簡単なのが、このホローマスクの錯視である。 背後から見たマスクは空洞ではなく、凸(外側に曲がっている)に見える(図5C)。 この錯視は、特に片目をつぶって見る場合に強く、中空マスクを下から照らし、上から照らした凸面マスクと同じように影とハイライトが落ちるようにする。 両目を開けていても、1.5mくらいまで近づくと、両眼視では錯視が解除される。 通常、人は過去の経験から「顔は凸である」という強い期待を持っており、その解釈に固執してしまうという説明がなされる。 しかし、期待だけでは不十分で、感覚的な手がかりがあいまいであることが必要である。 そこで、片目をつぶったり、遠くから見たりして両眼の奥行き手がかりを減らしたり、照明の方向を変えたりして誤解を生じさせる手がかりを加えると、錯視はさらに強くなる。 奥行きの手がかりが十分にあいまいであれば、中空のゼリー型やワイヤーでできた幾何学的な形状のモデル(ワイヤーキューブなど)でも錯視的な反転が得られる可能性がある。 しかし、この効果は、直立した顔のような、私たちが凸であると強く期待する物体に対して最も強く現れる(Hill and Johnston, 2007)。

私たちの知覚が、事前の期待と感覚的な証拠を統合するプロセスから生まれるように、私たちも複数の感覚チャネルからの証拠を統合しなければなりません。 鍋の中で泡立つソースには色と感触があり、柔らかい破裂音がし、かき混ぜるのに物理的な抵抗があり、(うまくいけば)おいしそうな香りがします。 これらの感覚は、料理という統一された知覚体験を生み出すために組み合わされ、あなたが思う以上に相互依存しているのです。 この相互依存性は、感覚チャネル間に人工的なミスマッチを作り出すことで実証することができる。 そのような状況では、視覚からの情報が他の感覚を支配する傾向がある。 腹話術は、自分の声を別の場所から発しているように見せることから「声を投げる」と言われるが、そのトリックは、主に観客が見ているものを正確にコントロールすることにある。 腹話術師は自分の話す動きを隠しながら、話し方に合わせてダミーの口を動かして別の音源を暗示し、それをあたかも人が話しているかのように見つめるのである。

視覚情報は、単に声の位置を変えるだけでなく、聞こえてくる音声を再形成することができる。 マクガーク効果では、「バ・バ」という音節を繰り返す人の音声を聞き、別の頭子音を持つ音節(例えば「ダ・ダ」「ヴァ・ヴァ」)を口にする人の映像を同期させています3。 視覚は味覚の印象も変えるので、料理の見た目は食体験に欠かせません。 野菜は色が鮮やかな方が新鮮に感じられ、リンゴジュースは味のない赤い着色料を加えるとラズベリーのような味になると報告されています。 同じ赤い着色料を白ワインに加えると、ワインの熟練テイスターを騙して、赤ワインに典型的な風味を報告させることができる(Spence, 2010)。 同様に、私たちの平衡感覚は文字通り視覚によって揺さぶられます。私たちが固い床の上に立ち、周りの壁がわずかに揺れる「スイングルーム」の中に置かれると、近づいてくる壁に向かって落ちていると感じ、それを補うために正しく後方に傾きます(そして若い子供たちは典型的に転倒します)(Lee and Aronson, 1974)

多感覚の錯覚には、視覚も含まれることがあります。 羊皮紙の皮の錯視は、音が触覚に与える不穏な効果を説明したものである。 手をこすり合わせて出す音をヘッドフォンで聞き、高音域を強調したリミックスをすると、手が乾燥してカサカサに感じられる。 また、ポテトチップスを食べるときにも、同じように高音域を強調した音を聞くと、より新鮮でサクサクした食感に感じられるという。 このような効果が生じるのは、私たちの知覚システムが、あらゆる事象を解釈する際に、利用可能なすべての感覚情報源からの証拠を統合し、何が最も可能性が高いかについての予備知識も利用するためである。 もしマクガーク効果や羊皮紙の皮の錯視が意外に思えるなら、それは主に、我々の感覚は経験上豊かに混ざり合っているのではなく、分離して別個に存在するという誤解を招くためであろう。 他の認知的錯覚と同様に、これらの多感覚効果も、実際には刺激の総パターンについての良い推測であるのに、知覚の失敗と考えるのが公正であるかどうかは疑問である。

多くの研究者の想像力をかきたてた多感覚錯覚に、ゴム手錯視(Botvinick and Cohen, 1998)がある。 実験者が撫でたり突いたりするダミーの手の前に人が座っている。 実験者のもう片方の手は、遮蔽されたスクリーンの後ろに隠された人の本当の手に、一連のストロークとプッシュを同期して加える。 これにより、被験者はダミーハンドへのタッチのパターンが見えると同時に、それに対応するタッチを感じることができる。 視覚と触覚の一致は、それ以外の方法で解釈するにはあまりに不自然である。 この錯覚の鮮やかさは、例えばナイフやハンマーで脅かされた手を見たときに、その人が自動的に防衛反応を起こすことからもよくわかる。 これは、マネキンやバービーやケンなどのおもちゃの人形の中にいるように感じたり、自分の体の外に立って見ているように感じたりする「身体性錯覚」の一例に過ぎない(Petkova and Ehrsson, 2008)。

視覚と触覚の統合に依存する体現の錯覚は、説得力がありますが、受動的であるため、一般にかなり限定的です。 本人が動作を決めても、ダミーの手がそれに従わなければ、所有者意識と矛盾してしまい、錯覚は終わってしまいます。 ダミーハンドを自在に動かし、触れたものを感じたり操作したりできれば、より説得力のある能動的な体験ができるはずです。 高解像度のパノラマビジョン、サラウンドサウンド、触覚フィードバックのグローブやスーツなど、現代のバーチャルリアリティは、そうした没入体験に向かって進んでいるのです。 この種の十分に高度なシステムは、物理的な世界と区別がつかなくなる。したがって、我々の現実が幻想であるかどうかにかかわらず、十分に完全な幻想が我々の現実になりうるのである

コメントを残す

メールアドレスが公開されることはありません。