Microsoft logra traducciones en tiempo real

Rick Rashid, investigador jefe de los laboratorios de Microsoft Research, dio una demostración de sus avances en linguística computacional: están desarrollando el software capaz de unir reconocimiento de voz + traducción simultánea + conversión a voz en el idioma de destino imitando tu voz… en tiempo (prácticamente) real. Y dieron un ejemplo de inglés a chino nada menos.

El vídeo es un poco largo pero es interesante por cómo está presentado y para el que quiera entender la explicación completa de la tecnología, que incluye la utilización de redes neuronales «profundas» para reducir el número de errores tanto en la traducción como en el reconocimiento de voz.

Pero el detalle más interesante es que con sólo una hora de entrenamiento, el sistema de Microsoft es capaz de imitar el mismo tono de voz que la persona que lo está utilizando. Aunque pueda parecer algo simple, esta traducción “al vuelo” tiene dos fases que son bastante complejas. Por un lado, el sistema debe reconocer la voz, distinguir las palabras y, en este caso, traducirlas al chino pero, además, debe tener bien programada la gramática de cada idioma para que el orden de las palabras tenga sentido.

Y la tasa de error es de una palabra cada por cada 7 u 8, la más baja conseguida hasta la fecha. Un avance impresionante, lo que no quita que dentro de 20 años tengamos que soportar escuchar androides que hablan mal porque falten pulir detallecitos de estas tecnologías.

Visto en Microsiervos y alt1040