Las interfaces para conversaciones, reconocimiento de voz que le permite a los usuarios hablar directamente a través de sus dispositivos (en vez de escribir), finalmente están empezando a salir de la ciencia ficción con aplicaciones totalmente funcionales. Y esta revolución la está ganando China.
Escribir en cualquier idioma puede tomar mucho tiempo y puede ser frustrante, pero en China, donde el lenguaje es complejo (con, literalmente, miles de caracteres), la mecanografía en cualquier dispositivo es un reto. Así que no es sorpresa que este país esté a la vanguardia en la creación de eficaces interfaces para conversaciones.
En la actualidad, los actores clave en el reconocimiento de voz y procesamiento de lenguaje son Google, Apple, Nuance, Facebook y, la empresa china, Baidu. Con Google bloqueado en China, Baidu, fundada en el año 2000, es el motor de búsqueda más importante de ese país y domina el 70 % del mercado, ya que ofrece servicios como banca, seguros y transmisión de películas y/o música.
En noviembre pasado, Baidu alcanzó un importante punto de referencia en su tecnología de voz con el Deep Speech 2, un nuevo y potente motor de reconocimiento de voz con una amplia red neural que aprende a asociar sonidos con palabras y frases. Deep Speech 2 es tan avanzado, que los investigadores han encontrado que a veces puede transcribir el chino mandarín con más precisión que una persona.
¿Utilizas sistemas de reconocimiento de voz como Siri o Google Now o todavía eres de los que escribe mensajes en el smartphone? Déjanos tus comentarios a continuación.