La información visual y auditiva son clave en la comprensión del habla. Cuando conversamos con alguien, no nos limitamos a oír lo que dice, sino también nos fijamos en cómo lo dice moviendo sus labios.
La capacidad del habla humana se fundamenta en la integración de información visual y auditiva, algo que queda evidenciado en el hecho de que podamos experimentar un curioso fenómeno ilusorio: el efecto McGurk.
Se puede decir que este peculiar fenómeno se da cuando oímos con los ojos, haciendo que lo que oímos cambie en función de lo que vemos. Descubramos en qué consiste este interesante efecto visuoauditivo.
- Artículo relacionado: "17 curiosidades sobre la percepción humana"
¿Qué es el efecto McGurk?
Solemos creer que nuestros sentidos funcionan de forma independiente: cuando oímos, sólo oímos; y cuando vemos, sólo vemos. Partiendo de esta creencia, sería razonable pensar que un estímulo visual no es capaz de distorsionar nuestra forma de percibir el sonido. Sin embargo, la realidad es que sí puede, puesto que nuestras experiencias perceptivas son producto de un complejo proceso de mezcla de información, misma mezcla que da origen a un peculiar fenómeno: el efecto McGurk.
Seguro que en más de una ocasión has mantenido una conversación en un entorno sumamente ruidoso. Puede que fuera en una discoteca, en la terraza de un bar de una calle muy transitada o en el aula de un instituto. Cuando hay ruido elevado de fondo nos cuesta entender lo que nos dice la persona que tenemos justo delante y, con tal de lograr entender algo, usamos el viejo e instintivo truco de observar su boca mientras habla.
En estos casos, la información visual y la auditiva no se analizan por separado, sino que se combinan. El cerebro humano tiene una región llamada surco temporal superior, el cual está especializado en combinar ambos tipos de información, en los ejemplos que hemos dado se encargaría de combinar los fonemas que pronuncia nuestro interlocutor con el movimiento de sus labios.
Debido a esta capacidad para combinar información multimodal, el surco temporal superior es el escenario neurológico donde se produce el ilusorio efecto McGurk, que no sería más que el resultado de un error en la decodificación del mensaje al interactuar dos modalidades sensoriales diferentes, haciendo que lo que vemos no coincida con lo que escuchamos.
Si hacemos una búsqueda rápida en Youtube, podemos encontrar más de un vídeo en donde se expone de forma práctica este fenómeno. Este enlace nos dirige a un buen ejemplo de este fenómeno:
En este caso en concreto, la persona del vídeo pronuncia todo el rato /ba/, sin embargo, en función de cómo mueva los labios se puede oír o bien /ba/ o bien /pa/.
Este efecto también puede darse con otras combinaciones de sílabas. Por ejemplo, se puede conseguir con la combinación /ka/ (visual) y /pa/ (auditiva), la cual da lugar a la percepción de /ta/. Otro ejemplo sería ver a alguien que hace movimientos con los labios que se corresponden con la sílaba /ga/ pero mientras se emite la sílaba /ba/ se percibirá como /da/.
La forma en cómo escuchamos un mismo sonido varía drásticamente según si nos fijamos en la forma en cómo mueve los labios la persona que nos está hablando. Esto no solo afecta a la percepción de conjuntos simples de sonidos como lo son las sílabas, sino que también se ha comprobado que funciona con frases completas, aunque seguramente tú mismo hayas sido testigo de ello en alguna de las situaciones que hemos mencionado antes.
Uno de los primeros hallazgos relacionados con el efecto McGurk y la interacción entre modalidades sensoriales es que tener la posibilidad de ver cómo mueve los labios nuestro interlocutor mejora considerablemente el volumen de lo que oímos.
Se ha visto que nos da la sensación de oír hasta 15 decibelios más fuerte los fonemas cuando tenemos al emisor dentro de nuestro campo visual. Esto se da incluso cuando las condiciones acústicas no son adversas como, por ejemplo, estar en una habitación sin sonido alguno o en un lugar calmado.
- Quizás te iterese: "Partes del cerebro humano (y funciones)"
Historia de su descubrimiento
Este fenómeno fue descrito por primera vez en 1976 en un artículo del psicólogo cognitivo británico Harry McGurk junto con su colega John MacDonald titulado "Hearing lips and seeing voices" (“Escuchar labios y ver voces”). Su estudio original iba a consistir en investigar sobre los patrones de imitación de un grupo de niños que estaban desarrollando la capacidad del habla y el experimento implicaba presentarles varios vídeos de personas pronunciando diferentes sílabas.
Sin embargo, ocurrió un error en la reproducción. El técnico encargado de montar el vídeo se equivocó e hizo que imagen y sonido no se sincronizaran, haciendo que se viera la grabación de una persona pronunciando algo que no se correspondía con el sonido que se oía.
En el momento de reproducir el vídeo, McGurk y MacDonald escucharon un tercer fonema en lugar del que se articulaba con los labios y el que se emitía. Fue la serendipia lo que quiso que estos dos investigadores descubrieran esta peculiar ilusión auditiva.
- Artículo relacionado: "Neuropsicología: ¿qué es y cuál es su objeto de estudio?"
Su importancia en el estudio del habla humana
El descubrimiento de este efecto es considerado una prueba de que el sistema visual y el auditivo han evolucionado conjuntamente para permitir, entre otras cosas, un mejor procesamiento del habla. Nuestro sistema visual nos ayuda a discriminar sonidos que son difíciles de diferenciar, una ventaja que llevan a cabo las personas sordas cuando leen los labios.
Poder ver cómo nuestro interlocutor mueve los labios incrementa la confianza sobre el mensaje percibido a través del sistema auditivo. Es decir, si dos sistemas independientes apuntan hacia la misma solución, en este caso el mismo mensaje, se confía más en ese mensaje que si sólo lo recibimos a través de un canal.
Cabe mencionar que el efecto McGurk no se produce de forma automática. Para que se dé, es necesario que prestemos atención a nuestro interlocutor y, cuando se incorporan estímulos distractores, tanto visuales como auditivos, esta ilusión se ve atenuada.
De hecho, esto prueba que el efecto no se debe a una mala recepción de la información visual o auditiva, sino a un error en la integración de esas dos modalidades sensoriales.
Otro hecho que da fuerza a la idea de que el sistema visual apoya al auditivo es que, cuando vemos a una persona que nos habla pero no podemos oír en absoluto lo que nos dice, no solo se activa nuestra corteza visual, sino que también lo hace la auditiva, aunque no estemos escuchando nada.
- Quizás te interese: "Nervio óptico: partes, recorrido y enfermedades relacionadas"
El efecto McGurk y las disfunciones cerebrales
Se ha visto que las lesiones en el cerebro y sufrir disfunciones en habilidades lectoras, además de manifestar trastornos mentales, influye en la probabilidad de que se dé el efecto McGurk.
Las personas que han padecido una callosotomía manifiestan el efecto McGurk de forma más lenta. Parece ser que los niños con trastorno específico del lenguaje presentan el efecto McGurk de forma más debilitada en comparación con aquellos niños que no presentan trastornos de la adquisición del lenguaje ni dificultades de lectoescritura.
También influye la lateralidad, viéndose que las personas diestras son más propensas a experimentar este efecto.
- Artículo relacionado: "Hemisferios cerebrales: mitos y realidades"
El efecto McGurk en diferentes idiomas
Al margen de qué lengua se hable, sus hablantes dependen, en algún grado, de la información visual durante la percepción del habla. No obstante, se ha visto que la intensidad del efecto McGurk varía de lengua en lengua, viéndose que en idiomas como el español, el turco, el italiano, el neerlandés, el inglés y el alemán sus hablantes experimentan este efecto de forma más fuerte que los hablantes de chino y japonés.
Que los hablantes de lenguas asiáticas presenten el efecto McGurk con menor frecuencia puede deberse a la práctica cultural de evitar el contacto ocular. Añadido a esto, el chino y el japonés en concreto son dos idiomas con estructuras lingüísticas muy silábicas, usualmente de tipo consonante+vocal y consonante+vocal+consonante, lo que los hace especialmente habilidosos en la detección de sílabas al margen de cómo mueva los labios su interlocutor.
Newsletter PyM
La pasión por la psicología también en tu email
Únete y recibe artículos y contenidos exclusivos
Suscribiéndote aceptas la política de privacidad