bing voz

Las búsquedas por voz y la conversión de voz en texto centran la atención de empresas como Google, Apple o Microsoft. Precisamente los de Redmond acaban de anunciar el último avance que sus equipos de investigación han logrado en este campo. Han conseguido que el reconocimiento de voz de Bing sea más rápido y más preciso en diversos dispositivos. De hecho, esas mejoras ya están disponibles para los usuarios de Bing Voice Search en Windows Phone, aunque solamente en Estados Unidos (de momento). Los errores de reconocimiento se han reducido un 15 por ciento, y la velocidad se ha duplicado. Además existe otra ventaja: los resultados mejoran en entornos ruidosos, tanto en rapidez como en precisión. Los avances son aplicables tanto a las búsquedas por voz como a las tareas de conversión de voz a texto para escribir un mensaje.

Los investigadores de Microsoft han utilizado redes neuronales profundas (DNN) para desarrollar una nueva versión más eficaz del modelo acústico en el que está basado su sistema de reconocimiento de voz. Ese nuevo modelo informático, capaz de aprender, trata de replicar cómo el cerebro procesa el lenguaje, cómo el ser humano escucha y cómo interpreta la lengua hablada. El modelo DNN contiene cientos de millones de parámetros, que representan los patrones de la voz humana, pero requiere un proceso de entrenamiento por parte de los cientí­ficos de la casa. Al final el usuario del smartphone percibe una experiencia casi instantánea.

bing voz

Por ahora, son los usuarios de dispositivos móviles con sistema operativo Windows Phone 8 que además utilicen Bing los que van a beneficiarse de estos avances. Así­, van a poder disfrutar de un reconocimiento de voz el doble de rápido y con un acierto del 85 por ciento. El grado de precisión de las búsquedas de voz ha aumentado gracias al uso de redes neuronales profundas (DNN), que son capaces de interpretar los patrones de audio dependiendo del contexto. Otro beneficio es que los modelos DNN pueden aprender en varios idiomas, y las mejoras de precisión en un idioma pueden ayudar a otro. De esa forma se reducen los tiempos de entrenamiento, ya que estos modelos requieren trabajar con enormes cantidades de datos con ejemplos de lenguaje. Al fin y al cabo, la variabilidad de la pronunciación es amplia, incluso entre hablantes del mismo idioma.

Esta novedad del buscador por voz de Bing en dispositivos móviles viene a unirse a la introducción del traductor de Bing en la plataforma Windows Phone 8, disponible desde el mes de noviembre del año pasado. Aquellos que quieran comprobar las mejoras de las búsquedas de voz en Bing para Windows Phone pueden visionar este ví­deo, donde se muestra la experiencia de usuario, comparando entre el antes y el después. El ví­deo muestra pruebas de reconocimiento de lenguaje natural a la hora de realizar una búsqueda por voz, pero también de la conversión de voz en texto para escribir un mensaje.

Recibe nuestras noticias

De lunes a viernes mandamos un newsletter con los titulares del día a +4.000 suscriptores

I will never give away, trade or sell your email address. You can unsubscribe at any time.