Usan la inteligencia artificial para detectar el «habla silenciosa»: entender a los demás por el movimiento de su cara | Tecnología

Entender a aquellas personas que no pueden pronunciar las palabras de forma audible. Un equipo de investigadores trabaja para ayudar a estas personas y mejorar la comunicación.

Desde la Universidad de Berckley, un grupo de investigadores han presentado un proyecto basado en inteligencia artificial para descifrar lo que intentan decir las personas sin que sea necesario generar sonidos audibles. Hablar sin hablar

Son muchas las personas que por alguna enfermedad no puede hacerse entender mediante su voz o se encuentran en situaciones en las que el ruido ambiente impide que nos comuniquemos correctamente. Este proyecto de investigación podría aportar luz ante estos problemas. 

Los investigadores han conseguido analizar lo que ellos llaman «habla silenciosa» aplicando electromiografía (EMG), es decir, electrodos en la cara y la garganta para detectar el movimiento de los músculos faciales que activamos con cada palabra. El sistema inteligente analiza estos movimiento y lo traduce en palabras y frases comprensibles.


La inteligencia artificial ya está en boca de todos, pero poca gente sabe lo que es. ¿Cómo funciona? ¿Hasta dónde puede llegar? ¿Cuáles son sus limitaciones? Respondemos a estas preguntas.

Este enfoque ofrece una disminución del 64% al 4% en las tasas de error a la hora de generar esas palabras. Para conseguir esos buenos resultados, se utiliza un decodificador WaveNet para generar predicciones de voz. Los investigadores usaron un conjunto de datos de casi 20 horas de datos EMG faciales.

El equipo explica que entre las situaciones en las que puede ser útil esta tecnología podría usarse para «crear un dispositivo análogo a un auricular Bluetooth que permite a las personas mantener conversaciones telefónicas sin interrumpir a quienes las rodean. Un dispositivo de este tipo también podría ser útil en entornos en los que el ambiente es demasiado ruidoso para capturar el habla audible o donde es importante mantener el silencio«.

Como esta, otras tecnologías pretenden facilitar la comunicación entre los series humanos. Google hace años que enseño a su inteligencia artificial a leer los labios. También conocimos hace tiempo un proyecto para traducir el lenguaje de signos con unos guantes sensibles. 

Deja un comentario