51

Kinect: Cómo funciona su micrófono multiarray

Publicado el: 26/11/2010
Kinect
El nuevo periférico de la Xbox 360, Kinect, cuenta con un micrófono multiarray que es capaz de separar las voces que hay justo delante del resto de sonidos del entorno para chatear y utilizar comandos de voz. Aquí veréis cómo se realiza esta difícil tarea.

Un micrófono multiarray son muchos micrófonos colocados en fila alrededor de una superficie captando, todos ellos, el sonido que les llega en todas las direcciones. En el caso de Kinect tenemos, 4 micrófonos en línea, tres en el lado izquierdo y otro pegado a la derecha, todos ellos situados en la parte de abajo del dispositivo.

Como es lógico, si situamos micrófonos en distintos lugares, el sonido les llegará a éstos en instantes diferentes, de forma que, a groso modo, se puede calcular de dónde viene la fuente de sonido si se tiene en cuenta este desfase entre las señales que captan los micrófonos y la velocidad del sonido en el aire. Pero no sólo se puede calcular si el sonido viene de un lado o de otro, también se puede determinar aproximadamente su posición. Si alguien tiene ganas de saber cómo se calcula realmente, puede leerse este artículo científico, aunque hay que tener un alto nivel de conocimientos de física y matemáticas para entenderlo. Los micrófonos multiarray, simulan el funcionamiento de los oídos. Como todos sabemos, tenemos uno a cada lado de la cabeza y esto es para que cuando oigamos algo, nuestro cerebro calcule aproximadamente, y a partir de las diferencias de fase de la onda que le llega a cada oído, de dónde viene ese sonido.

Una vez calculado de dónde viene el sonido, un complejo algoritmo combina las señales de todos los micrófonos, obteniendo una señal que contiene el sonido que llega desde un cono imaginario que parte del dispositivo y que se expande hacia nosotros.

Además se hace un filtrado, eliminando todo lo que caiga fuera de las frecuencias de la voz humana (entre 80 y 1100 Hz) y subiendo el volumen a éstas, de manera que, se filtran los ruidos de ambiente y se amplifica la voz.

Por si todo esto fuera poco, el micrófono elimina los ecos que produce la voz al rebotar en muebles y paredes al calibrarse según la reverberación del entorno, aunque si cambias la posición de los muebles de la sala tendrás que volver a calibrarlo. El calibrado también se aprovecha para realizar el entrenamiento del reconocedor de voz, ya que debe tener alguna muestra de ésta para que pueda aprender a reconocerla.

Kinect cuenta con varios procesadores digitales de señales (DSP) que se encargan de procesar los complejos algoritmos necesarios para realizar estas tareas. Si se realizaran en la consola, consumirían demasiados recursos y no quedaría tiempo de procesador para mover los juegos. Aún con todo esto, no creo que la calidad del sonido sea tan buena como la que se consigue con el micrófono cerca de la boca, pero desde luego, es muchísimo más cómodo.

Pensamientos (0): Comentar
Categorías: , ,

Comparte:

Copia y pega en tu página:

Comparte
Escribe tus pensamientos computables

Respondiendo a los siguientes comentarios:

Para comprobar que eres un humano responde correctamente:

Esta pregunta no me gusta, ¡cambialá!

Ninguno de estos datos será almacenado.

(Escribe el correo electrónico)

Campo obligatorio.

(Escribe el correo eléctronico o los correos electrónicos separados por comas)

Campo obligatorio.

Para comprobar que eres un humano responde correctamente:

Esta pregunta no me gusta, ¡cambialá!