Exploradores web a base de voz

Actor de voz del navegador

VoiceXML, o Voice eXtensible Markup Language, es un lenguaje de marcado de diálogos que aprovecha las demás especificaciones para crear diálogos que incluyan voz sintetizada, audio digitalizado, reconocimiento de entrada hablada y de teclas DTMF (tono táctil), grabación de entrada hablada, telefonía y conversaciones de iniciativa mixta.
Las especificaciones asociadas, como Speech Synthesis Markup Language (SSML), Speech Recognition Grammar Specification (SRGS) y Call Control XML (CCXML), son tecnologías básicas para describir la síntesis del habla (texto a voz), las gramáticas de reconocimiento (reconocimiento automático del habla) y las construcciones de control de llamadas, respectivamente.
VoiceXML es el HTML de la web de voz, el lenguaje de marcado estándar abierto para aplicaciones de voz. Mientras que HTML supone un navegador web gráfico con pantalla, teclado y ratón, VoiceXML supone un navegador de voz con salida de audio (mensajes grabados y síntesis TTS), entrada de audio (ASR) y entrada de teclado (DTMF).

Lenguaje de programación voicexml

serie de libros (LNCS, volumen 4088)ResumenEl artículo describe un navegador web de voz basado en un algoritmo y una arquitectura mejorados de conversión de texto en voz, que permite acceder a los contenidos de Internet mediante la voz. Se trata de un navegador web visual y auditivo en términos de archivos HTML que se sintoniza con los procesos de TTS y de reconocimiento de voz. Los resultados de la evaluación de la voz muestran que el sistema tiene una mejor calidad de voz y una mayor identificabilidad de datos que otros navegadores de voz.Palabras claveSíntesis de voz Calidad de voz Código predictivo lineal Conversión de voz Identificabilidad de datos

Descarga del navegador de voz

Echemos un vistazo bajo el capó. En primer lugar, comprobamos si el navegador es compatible con la Web Speech API, verificando si existe el objeto webkitSpeechRecognition. Si no es así, sugerimos al usuario que actualice su navegador. (Por último, creamos el objeto webkitSpeechRecognition, que proporciona la interfaz de voz, y establecemos algunos de sus atributos y controladores de eventos.
El valor por defecto de continuo es falso, lo que significa que cuando el usuario deja de hablar, el reconocimiento de voz termina. Este modo es ideal para texto simple como campos de entrada cortos. En esta demostración, lo establecemos en true, para que el reconocimiento continúe incluso si el usuario hace una pausa mientras habla.
El valor por defecto de interimResults es false, lo que significa que los únicos resultados devueltos por el reconocedor son finales y no cambiarán. La demostración lo establece como verdadero para que obtengamos resultados tempranos e intermedios que pueden cambiar. Observe la demostración con atención, el texto gris es el texto que es interino y a veces cambia, mientras que el texto negro son las respuestas del reconocedor que están marcadas como finales y no cambiarán.

Interacción con dispositivos digitales basada en la voz

Se ofrece un nuevo y útil Internet Voice (IVB) para permitir a los usuarios navegar, y que se les “lea” información de la Web utilizando una interfaz de voz. El IVB lee, traduce y organiza el contenido HTML en XML de voz (VXML), que proporciona una interfaz de voz para leer e interactuar con las páginas web. Cuando un usuario accede a una página web, el IVB analiza la página HTML, organiza los datos en contenido y enlaces, y luego los traduce a VXML para facilitar la navegación a través de un dispositivo telefónico. De este modo, se puede acceder a las páginas web con contenido HTML con un dispositivo telefónico sin necesidad de utilizar un ordenador personal.
Recibir una solicitud a través del teléfono fijo o del dispositivo celular; recuperar un documento basado en la red y formateado para su visualización en un navegador visual; extraer el contenido del documento; convertir el contenido analizado en un formato VXML y presentar el contenido de forma audible.

Acerca del autor

admin

Ver todos los artículos