McGurk-hatás

Kognitív illúziók

Az érzékszervi információk gyakran kétértelműek, de a viselkedés hatékony irányítása megköveteli, hogy gyorsan jussunk egyértelmű észlelési értelmezésekhez. Ehhez az érzékszervi információt kiegészítjük a hasonló helyzetekről szerzett előzetes ismeretekkel és tapasztalatokkal. Úgy gondolhatunk erre az előzetes tudásra, mint ami a világ valószínűsíthető állapotára vonatkozó “legvalószínűbb” feltételezésekkel szolgál. Ez a stratégia a legtöbbször gyorsan eljut a helyes értelmezéshez, de ha a feltételezéseink tévesek, az észleléseink tévesek lesznek. A kognitív illúziókat gyakran ilyen tévesen alkalmazott feltételezésekkel magyarázzák. A “kognitív” kifejezés nem jelenti azt, hogy a feltételezések tudatosan történnek: általában a tudatosság radarja alatt vannak, mélyen gyökerezőek, sőt megingathatatlanok. Ez megmagyarázza, hogy a kognitív illúziók miért maradhatnak fenn változatlanul még akkor is, amikor már tudjuk, hogy becsaptak bennünket. Kognitív illúziók bármely érzékszervi modalitás és több modalitáson alapuló észlelés esetén is létrejöhetnek, de a látás ismét rengeteg példát szolgáltat.

Egyik-másik feltűnő vizuális illúzió az észlelési állandósági mechanizmusokból ered. Ezek az állandósági mechanizmusok általában a tárgyak valódi tulajdonságaira hangolnak bennünket, függetlenül attól, hogy változnak-e a számunkra jelentkező ingerek. Meggyőző példa erre a világossági állandóság, amelyet jól szemléltet az Adelson-féle sakktábla-illúzió (4A. ábra). Lehet, hogy vonakodunk elfogadni, hogy az A és a B csempe pontosan ugyanolyan szürkeárnyalatú, mert a B sokkal világosabbnak tűnik számunkra, de a csempe világosságának érzékelését nem az abszolút fénymennyiség határozza meg, amit visszaver, hanem annak becslése, hogy a beeső fény mekkora hányadát veri vissza. A B csempe látszólag árnyékban van, így egy világos csempét látunk, amely a halvány megvilágítás nagy részét visszaveri. Az A lap látszólag nincs árnyékban, így egy sötét lapot látunk, amely viszonylag kevesebbet ver vissza az erősebb megvilágításból. Hasonló beállításokat végzünk a fényforrás színére vonatkozóan is, hogy következtetni tudjunk a jelenetben lévő objektumok felületi visszaverődési tulajdonságaira (színállandóság). A 4B. ábrán látható eper a szürke árnyalataiban van megjelenítve, de mi pirosnak látjuk őket, mert automatikusan alkalmazkodunk a képen látható látszólagos kék-zöld megvilágításhoz. Az ilyen hatások jól szemléltetik az észlelőrendszer elképesztő képességét arra, hogy kompenzálja a fényviszonyok nagyfokú eltéréseit.

4. ábra. Perceptuális állandóságokból eredő illúziók. (A) Edward H. Adelson által létrehozott, a világossági állandóságot szemléltető sakktábla-illúzió. Az A csempe sokkal sötétebbnek tűnik, mint a B csempe, noha a szürke azonos árnyalatai. Hogy ezt magad is bebizonyítsd, lásd https://www.illusionsindex.org/ir/checkershadow vagy https://michaelbach.de/ot/lum-adelsonCheckShadow. (B) A színállandóságot szemléltető szürke eper, Akiyoshi Kitaoka alkotása. Az eper vörösnek tűnik, bár teljes egészében a szürke árnyalataiban van ábrázolva. (C) A Roger N. Shepard által készített, az alakállandóságot szemléltető “Fordulat”. A két asztallap nagyon különböző alakúnak tűnik, bár az egyiket valójában pontosan a másikra lehetne fektetni (lásd https://michaelbach.de/ot/sze-ShepardTables). (D) A méretállandóságot szemléltető Ponzo-illúzió. A felső vízszintes vonal hosszabbnak tűnik, mint az alsó, holott ugyanolyan hosszúak. (E) A Ponzo-illúzió Richard Wiseman által létrehozott változata. A fehér furgonok a távolsággal egyre nagyobbnak tűnnek, bár mindhárom azonos méretű a képen belül.

A másik érzékelési állandóság az alakállandóság, amely azt a képességünket írja le, hogy alkalmazkodunk a szemünkre vetített képek alakjának és méretének eltéréseihez, amikor egy tárgyat különböző nézőpontokból látunk. Az előttünk lévő asztalon lévő kör alakú érme optikai vetülete egy széles ellipszis, de az érzékelésünk kompenzálja a rövidített perspektívát, és az érmét körnek látjuk. Az alakállandóság erős illúziókat kelthet, ha a kétdimenziós (sík) képeket a szilárd tárgyakra vonatkozó feltételezésekkel értelmezzük. Shepard asztallapjai a 4C. ábrán azonos párhuzamosok – az egyiket pontosan rá lehetne fektetni a másikra -, de mivel a mélységben különbözőképpen elforgatott szilárd tárgyakként értelmezzük őket, érzékelésünk kompenzálja az egyik asztal hosszának és a másik szélességének előrerövidülését. Az eredmény az, hogy az objektíve azonos asztallapok radikálisan különbözőnek tűnnek számunkra, az egyik hosszú és keskeny, a másik rövid és széles (Shepard, 1990).

A formaállandóság egyik aspektusa a méretállandóság, amely azt a tendenciát írja le, hogy a távolabbi tárgyakat az érzékelésben felskálázzuk. Ez lehetővé teszi, hogy a tárgyakat a látótávolság változása ellenére viszonylag stabil méretűnek lássuk. A távozó barátunk optikai képe megfeleződik, ahogy kétszer olyan messzire kerül, de mi nem érzékeljük, hogy összezsugorodik; a zsugorodó kép érzékelése fokozatosan felfelé méreteződik, hogy kompenzálja a megnövekedett látótávolságot. Ennek az érzékelési átméretezésnek az erejét jól érzékelhetjük, ha egy-két percig egy erős fényforrásra, például egy lámpa izzójára bámulunk. Ezután egy sötét folt (a fény negatív utóképe) úgy tűnik, mintha bármelyik halvány felületre, amelyre nézünk, rávetülne. Ennek az utóképnek az optikai mérete állandó, és megfelel az erős fénynek kitett retinafoltnak, de az érzékelt mérete drámaian változik a nézett felület távolságától függően. A paca sokkal kisebbnek fog tűnni a kezünkben tartott fehér kártyán, mint egy távoli falon; még azt is megfigyelhetjük, hogy zsugorodik és növekszik, ahogy a kártyát az arcunk felé és távolabb mozgatjuk, vagy ahogy a fal felé és távolodunk tőle.

A Shepard asztallapokhoz hasonlóan a méretállandóság erős illúziókat kelthet, amikor egy sík képet úgy értelmezünk, mintha az egy mélységben lévő jelenet lenne. Gondoljunk a 4D ábrán látható Ponzo-illúzióra, amelyben a felső vonal hosszabbnak tűnik, mint az alatta lévő (azonos) vonal. E hatás egyik fő forrása az lehet, hogy az összefutó oldalvonalakat a világ párhuzamos vonalainak kivetüléseként látjuk, mint a távolba távolodó vonatsíneket. A felső vonalat így távolabbinak értelmezzük, ezért érzékelésünkben felskálázzuk, hogy kompenzáljuk. Ugyanez a hatás valós jelenetek képein is előidézhető azáltal, hogy az előtérből egy képelemet még nagyobb látszólagos távolságban reprodukálunk; a 4E. ábrán látható távoli fehér furgonok abszurd nagyítása megmutatja, hogy a méretérzékelésünk általában milyen mértékben skálázódik a távolság függvényében. Még egyes valós jelenetekben is hozzájárulhat a távolságjelzések félreértelmezése a méret illúziójához. Például a Hold sokkal nagyobbnak tűnhet, amikor alacsonyan van a horizonton, mint amikor magasan van az égen. Ez az égi illúzió évszázadok óta fejtörést okoz az embereknek, és több elméletet is javasoltak a magyarázatára (Ross és Plug, 2002). Az egyik felvetés szerint, amikor a Hold a horizonton van, általában közbeeső elemek, például épületek és fák jelzik a távolságot, így az érzékelt méret megnő. Egy másik szerint, amikor a Holdat magasan látjuk a jellegzetesség nélküli égbolton, a szemünk valójában rövidebb távolságra fókuszálhat és fixálhat, így az érzékelt méret csökken. Míg azonban a Hold látszólagos méretéről könnyedén tudunk beszámolni, az azt befolyásoló távolságjelzésekkel talán kevésbé vagyunk tisztában. Valóban, ha közvetlenül megkérdezik, az emberek általában közelebbinek ítélik a Holdat, amikor a horizonton van, talán arra a (téves) következtetésre jutva, hogy ha nagyobbnak tűnik, akkor közelebb kell lennie.

Ezek közül több illúzió esetében, különösen amikor képekkel csapnak be minket, kissé igazságtalannak tűnik azt mondani, hogy valóban tévedünk, mert az érzékelés a valóságban változatlanul pontos lenne. Egy árnyékban szürke csempe valóban világos felületű lenne, egy kék-zöld fényben szürke eper valóban piros gyümölcs lenne, és Shepard asztalai két nagyon különböző formájú bútordarab lennének. Tekintettel arra, hogy érzékelő rendszereink az evolúció során és minden egyes életünk során úgy fejlődtek ki, hogy támogassák a valós világgal való foglalatosságot, ezeket az észleléseket inkább sikernek, mint kudarcnak tekinthetjük. Arra optimalizáltak bennünket, hogy a tárgyak felületi tulajdonságait lássuk, nem pedig a visszavert hullámhosszokat, és hogy megértsük a szilárd tárgyak formáit, nem pedig a sík síkba vetítéseket (amihez évekig tartó művészeti képzésre lehet szükség). Amikor a valós világbeli jelenetekben illúziók keletkeznek, az általában azért van, mert a jelenet nagyon valószínűtlen, vagy egyszerűen nem olyan, amelyre a rendszerünket tervezték. Például a távolságok és méretek megítélésére szolgáló kifinomult mechanizmusaink kudarcot vallanak, amikor az égitestekre alkalmazzuk őket, mert az érintett távolságok és méretek olyannyira kívül esnek a tapasztalatainkon, és mert nem számít, hogy pontosan érzékeljük-e őket vagy sem. Biztonsággal feltételezhetjük, hogy soha senki nem halt meg azért, mert rosszul ítélte meg a Hold méretét.

Ha arra terveztek minket, hogy aktívan foglalkozzunk a szilárd tárgyak földi világával, ez megmagyarázhatja, miért nem tudjuk elkerülni, hogy egy kép mélységértelmezését lássuk, ahol ez lehetséges, még akkor is, ha tudjuk, hogy a kép valójában lapos. Annyira hozzászoktunk a perspektívához és az árnyékoláshoz a művészetben, valamint a fényképekhez és a videókhoz, hogy könnyen elfelejtjük, milyen figyelemre méltó mélységillúziót keltenek bennünk. Talán az a fő oka annak, hogy a 3D-s filmek, amelyek sztereoszkópikus mélységet adnak a moziélményhez, soha nem ragadták meg a képzeletet, hogy a 2D-s filmekből már olyan gazdag mélységet kapunk. Miközben ezeket nézzük, a látásunk csak azt teszi, ami természetes (a jelenet mélységszerkezetének elemzése), de egy olyan ingerrel, amely természeténél fogva nagyon valószínűtlen (a jelenet lapos ábrázolása). Ez megismétli a kognitív illúziókkal kapcsolatos általánosabb pontot: az érzékelő rendszereink által az érzékelések valószínű okaira vonatkozóan tett feltételezések a szilárd tárgyak ismerős világán alapulnak, amelyek (többnyire) kiszámítható módon viselkednek. Amikor valószínűtlen helyzetekkel szembesülünk, ahol ezek a feltételezések nem állnak fenn, akkor a legjobb sejtéseink is tévesek lehetnek, és illuzórikus téves észlelések következnek.

A képsíkon túl néhány megdöbbentő illúziót idézhetnek elő a valószínűtlen háromdimenziós struktúrák, amelyek arra hívnak minket, hogy félreértelmezzük alakjukat. Több ördögien ravasz konstrukciót talált ki Adelbert Ames Jr. A leghíresebb ezek közül egy olyan szoba, amely az egyik falon lévő kukucskálón keresztül nézve normálisan kocka alakúnak tűnik, de valójában egyáltalán nincs derékszöge, és geometriailag úgy van megnyújtva, hogy az egyik szemközti sarok sokkal távolabb van a szemtől, mint a másik (5A. ábra). A vizuális benyomás az, hogy a szemközti sarkok egyenlő távolságra vannak egymástól, így nem történik méretállandósági átméretezés, amikor látjuk, hogy egy személy az egyik oldalról a másikra sétál, és úgy tűnik, hogy közben nő és zsugorodik. A 3D-illúzió kortárs mestere Kokichi Sugihara matematikus, aki más rendkívüli tárgyak mellett olyan “mágnesszerű lejtőket” konstruált, amelyeken a labdák látszólag felfelé gurulnak (5B ábra) (Sugihara, 2014). Az ilyen aprólékos konstrukciók olyan erősen alapozzák meg a valószínű tárgyak alakjára vonatkozó feltételezéseinket, hogy kénytelenek vagyunk lazítani azon intuíciónkon, hogy a labdák nem gurulnak felfelé, vagy hogy az emberek nem változtatják varázslatos módon a méretüket. Ezek a hatások akkor működnek a legjobban, ha egy szemmel – vagy kamerával – fix pozícióból nézzük, így a kép pontosan megfelel az illuzionista szándékának, és a binokuláris látás vagy a változó nézőpont nem ad ellentmondó mélységjelzéseket. Amint a nézőnek lehetővé válik, hogy a jelenetet körbejárva felfedezze, a valódi mélységszerkezet feltárul, és a varázslat megtörik. Így ezek az illúziók, bár háromdimenziós felépítésűek, végső soron mégis az általuk vetített lapos képi képekből nyerik hatásukat.

5. ábra. (A) Az Ames-terem az edinburgh-i Camera Obscura és az Illúziók világában. (B) Kogichi Sugihara által létrehozott mágnesszerű lejtők, amelyeken az illúzióhatás ideális látványa látható, valamint egy oldalnézet, amely felfedi a szerkezetet. A teljes hatás a https://www.youtube.com/watch?v=hAXm0dIuyug megtekintésével értékelhető. Más bemutatók a http://www.isc.meiji.ac.jp/∼kokichis/impossiblemotions/impossiblemotionse alatt találhatók. (C) Üreges maszkok bemutatója az edinburgh-i Camera Obscura és World of Illusions kiállításon, oldalnézetből. Figyeljük meg, hogy az üreges maszkok domborúnak tűnnek, és a néző felé dőlnek. A dinamikus bemutatót lásd https://michaelbach.de/ot/fcs-hollowFace.

A több nézőpontot jobban toleráló, és könnyebben felállítható üreges maszk illúzió. A hátulról nézve a maszk egyáltalán nem tűnik üregesnek, hanem domborúnak (kifelé görbülőnek) (5C. ábra). Ez az illuzórikus mélységfordulat meglehetősen erős, különösen akkor, ha az egyik szemet csukott szemmel nézzük, és az üreges maszkot alulról világítjuk meg, hogy az árnyékok és a fénypontok úgy essenek, mint egy konvex maszkon, amelyet hagyományos módon felülről világítanak meg. Még nyitott szemmel is megközelíthetünk egy üreges maszkot körülbelül másfél méterre, mielőtt a binokuláris látás eloszlatná az illúziót. A szokásos magyarázat az, hogy a korábbi tapasztalatok alapján erős elvárásaink vannak arra vonatkozóan, hogy az arcok domborúak, ezért ragaszkodunk ehhez az értelmezéshez. A várakozások azonban csak egy része a történetnek; az is szükséges, hogy a rendelkezésre álló érzékszervi jelek teret engedjenek a kétértelműségnek. Ezért az illúzió fokozódik, ha a binokuláris mélységjelzéseket csökkentjük (az egyik szem becsukásával vagy távolabbról történő nézéssel), vagy félrevezető jeleket adunk hozzá (a megvilágítás irányának megváltoztatásával). Ha a mélységjelzések kellően kétértelműek, akkor számos más forma, például üreges zseléformák vagy geometriai alakzatok drótmodelljei (pl. egy drótkocka) esetében is lehet illuzórikus megfordulást elérni. Mindazonáltal a hatás a legrobosztusabb a nagyon ismerős tárgyak esetében, mint például a függőleges arcok, amelyekről erősen elvárjuk, hogy konvexek legyenek (Hill és Johnston, 2007). Minél erősebbek az előzetes várakozásaink, annál inkább hajlamosak felülírni az érzékszervi bizonyítékokat, és fordítva.

Amint ahogy az érzékelésünk az előzetes várakozások és az érzékszervi bizonyítékok integrálásának folyamatából ered, úgy kell integrálnunk a több érzékszervi csatornából származó bizonyítékokat is. A serpenyődben fortyogó szósznak színe és állaga van, lágy pukkanó hangokat ad, fizikai ellenállást tanúsít a keverésnek, és (remélhetőleg) finom illata van. Ezek az érzékszervi aspektusok együttesen hozzák létre a főzés egységes érzékelési élményét, és jobban függenek egymástól, mint gondolnánk. Ezt az egymásra utaltságot úgy lehet demonstrálni, hogy mesterséges eltéréseket hozunk létre az érzékszervi csatornák között. Ilyen körülmények között a látásból származó információ hajlamos dominálni a többi érzékszervet. A hasbeszélést “hangdobálásnak” nevezik, mert a hasbeszélő a saját hangját máshonnan érkezőnek tünteti fel, de a trükk elsősorban annak pontos ellenőrzésében rejlik, hogy a közönség mit lát. A hasbeszélő elrejti saját beszédmozdulatait, miközben a beszéddel együtt mozgat egy műszájat, hogy alternatív forrást sugalljon, amelyet úgy néz, mintha egy beszélő személy lenne. Még ilyen bonyolult megtévesztés nélkül is automatikusan a színészekhez lokalizáljuk a filmekben hallható hangokat, holott a hangrendszer akár több méterre is lehet a képernyőtől.

A vizuális információ nem csak a hang észlelt helyét változtatja meg, hanem a hallott beszédhangokat is átformálja. A McGurk-effektusban egy hangfelvételt hallunk egy személyről, aki egy szótagot ismételget, “ba-ba”, és ehhez egy szinkronizált videófelvétel társul, amelyen egy személy egy más kezdő mássalhangzóval (pl. “da-da”, “va-va”) rendelkező szótagot mond.3 Az általunk hallott szótag a látott beszédmozgásoktól függ, és a hallási érzékelésünk “ba”-ról “da”-ra “va”-ra vált, amikor ugyanaz a hangfelvétel különböző videókkal párosul. A látás is megváltoztathatja az ízlelési benyomásainkat, ezért van az, hogy egy étel kinézete annyira szerves része az étkezés élményének. A zöldségek a beszámolók szerint frissebb ízűek, ha élénkebb színűek, az almalé pedig málnaízűnek tűnik, ha ízléstelen piros színezéket adunk hozzá. Ugyanez a vörös színezőanyag fehérborhoz adva megtévesztheti a szakértő borkóstolókat, hogy a vörösborokra jellemző ízjegyekről számoljanak be (Spence, 2010). Hasonlóképpen, az egyensúlyérzékünket szó szerint megingathatja a látás: ha egy “lengő szobába” kerülünk, amelyben egy szilárd padlón állunk, és a falakat kissé meglendítik körülöttünk, úgy fogjuk érezni, hogy a közeledő fal felé zuhanunk, és korrekten hátradőlünk, hogy kompenzáljuk (a fiatalabb gyerekek pedig jellemzően elesnek) (Lee és Aronson, 1974).

A multiszenzoros illúziók nem mind a látást érintik. A pergamenbőr-illúzió azt a nyugtalanító hatást írja le, amelyet a hang a tapintásérzékelésünkre gyakorolhat. Ha összedörzsöljük a kezünket, és az általuk keltett hangot fejhallgatón keresztül továbbítva, de a magas frekvenciák hangsúlyozására újrakeverve halljuk, a kezünket száraznak és hámlónak fogjuk érezni. Ugyanez a hangkezelés kellemesebb hatással van a chipsfogyasztás élményére, amelyet frissebbnek és ropogósabbnak értékelünk, ha több magas frekvenciát hallunk, miközben beleharapunk. Ezek a hatások azért alakulnak ki, mert bármilyen esemény értelmezéséhez az érzékelő rendszerünk az összes rendelkezésre álló érzékszervi forrásból származó bizonyítékot integrálja, valamint előzetes ismeretekre támaszkodik arról, hogy mi a legvalószínűbb. Ha a McGurk-effektus vagy a pergamenbőr-illúzió meglepőnek tűnik, ez főként annak a félrevezető elképzelésnek köszönhető, hogy az érzékszerveink különállóak és különállóak, nem pedig gazdagon keverednek a tapasztalatban. Más kognitív illúziókhoz hasonlóan kérdéses, hogy igazságos-e ezeket a multiszenzoros hatásokat az észlelés hibáinak tekinteni, amikor valójában meglehetősen jó becslések az ingerlés teljes mintázatáról.

Az egyik multiszenzoros illúzió, amely sok kutató fantáziáját megragadta, a gumikéz-illúzió (Botvinick és Cohen, 1998). Egy személy egy műkéz előtt ül, amelyet egy kísérletvezető simogat és bökdös. A kísérletvezető másik keze szinkronizált simítások és döfések sorozatát alkalmazza a személy valódi kezén, amely egy eltakaró képernyő mögött van elrejtve. A személy így a műkéz érintéseinek mintáját látja, miközben érzi a megfelelő érintéseket. Tudja, hogy a kéz hamis, mégsem tud szabadulni attól a benyomástól, hogy az valamilyen módon a teste része; a látvány és az érintés egybeesése túlságosan valószínűtlen ahhoz, hogy másként lehessen értelmezni. Ennek az illúziónak az elevenségét jól szemlélteti a személy automatikus védekező reakciója, ha a kezet fenyegetve látja, például egy késsel vagy kalapáccsal. Ez csak egy példa a “megtestesülési illúziók” sorából, amelyek közé olyan beállítások tartoznak, amelyek azt az érzést kelthetik bennünk, mintha egy próbababa, vagy egy játékbaba, például Barbie vagy Ken testében lennénk, vagy mintha a testünkön kívül állnánk és néznénk (Petkova és Ehrsson, 2008). Önérzetünknek ez a készséges átformálása azt sugallja, hogy érzékelési valóságunknak még ez a legszemélyesebb aspektusa is közvetett következtetés, agyunk legjobb kísérlete a rendelkezésre álló bizonyítékok értelmezésére.

A látás és a tapintás integrációjától függő érzékelési illúziók meggyőzőek lehetnek, de jellemzően meglehetősen korlátozottak, mivel passzívak. Ha a személy úgy dönt, hogy mozdulatot tesz, de a műkéz nem engedelmeskedik, ez ellentmond a birtoklás érzésének, és az illúziónak vége. Sokkal lenyűgözőbb, aktívabb élményt jelentene, ha a személy a bábu kezét tetszés szerint mozgathatná, és érezné és manipulálhatná az általa megérintett tárgyakat. A modern virtuális valóság, a nagy felbontású panoráma látás, a térhatású hangzás és a tapintható visszajelzést adó kesztyűk és ruhák az ilyen magával ragadó élmények felé halad. Egy elég fejlett ilyen rendszer megkülönböztethetetlen lenne a fizikai világtól; így akár illúzió a valóságunk, akár nem, egy kellően teljes illúzió a valóságunkká válhatna.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.