30/04/2003 07:30): Los investigadores de Intel Corporation han lanzado un software bajo una licencia de código abierto que permite a los desarrolladores crear ordenadores que ven y “leen los labios” de la misma manera que lo hacen los humanos para entender mejor los comandos hablados.

Los potentes algoritmos de reconocimiento de voz actuales funcionan bien cuando se elimina el ruido de fondo o se utiliza un casco bien sintonizado, pero su exactitud se degrada rápidamente cuando las aplicaciones tienen que enfrentarse a entornos naturalmente ruidosos, tales como los lugares públicos. Combinado con algoritmos de detección de cara de la librería de visión informática OpenCV de Intel, el software Audio Visual Speech Recognition (AVSR) permite a los ordenadores detectar la cara de un orador y seguir los movimientos de su boca. La sincronización de datos de vídeo con la identificación del habla permite un reconocimiento de voz mucho más exacto, mejorando así una amplia variedad de aplicaciones de voz en entornos ruidosos. El software AVSR forma parte de la librería de visión informática OpenCV de Intel, una caja de herramientas de más de 500 funciones de tratamiento de la imagen que ayuda a los investigadores a desarrollar aplicaciones de visión informática.

“Intel quiere desarrollar tecnologías que permitan a los ordenadores interactuar de forma natural con el mundo, de la misma manera que lo hacen los humanos. El reconocimiento humano raramente se basa en un solo tipo de información. Tomamos decisiones combinando información procedente de varias fuentes,” dijo Justin Rattner, Intel Senior Fellow, Enterprise Platform Group y Director de los Microprocessor Research Labs de Intel. “Seguro que la adición de código de Reconocimiento de Voz Audio/Vídeo a la librería OpenCV de Intel fomentará la investigación y desarrollo en reconocimiento de voz asistido por la visión.”

Acelerando la Investigación de Nuevos Usos
Los microprocesadores más rápidos, la reducción del precio de las cámaras y diez veces más ancho de banda para la captura de vídeo de tecnologías tales como USB2 están permitiendo ejecutar en PCs corrientes algoritmos de visión informática en tiempo real. OpenCV está diseñado para incrementar la innovación en este campo al proporcionar código fuente para una amplia gama de funciones de visión y tratamiento de la imagen informáticos. Desde su lanzamiento en el año 2000, OpenCV ha registrado más de 500.000 descargas de código y ha atraído a más de 5.000 miembros registrados a su grupo de usuarios.

Los desarrolladores están utilizando el código OpenCV en aplicaciones que abarcan desde los juguetes hasta la fabricación industrial. El software incluye código fuente C para toda la funcionalidad de la librería y una licencia de redistribución sin royalty. Se encuentra más información sobre AVSR en www.intel.com/research/mrl/research/avcsr.htm. La página web de OpenCV se encuentra en http://www.intel.com/research/mrl/research/opecv. Las personas interesadas en unirse al grupo de usuarios pueden registrarse en groups.yahoo.com y luego pueden suscribirse enviando un correo electrónico a OpenCV a la dirección [email protected].

Intel ha desarrollado un modelo de investigación descentralizado único con más de 70 laboratorios ubicados en todo el mundo. La mayoría del equipo del software AVSR reside en el Centro de Investigación Chino de Intel en Beijing, China. Establecido en 1998, el centro emplea en la actualidad a más de 40 científicos e ingenieros en investigación informática que trabajan en áreas de investigación tales como la visión informática, los medios, las redes Bayesas, los compiladores y las herramientas.