VoiceXML Italian User Group

Home page  VoiceXML Links  VoiceXML Tutorial  News dai Working Groups Voice Browser e Multimodal Interaction del World Wide Web Consortium  Articoli  Accessibilita' del web mediante la voce

Libri Voice & Speech technologies  La nostra Newsletter  Il nostro Forum  Contatti  Gli eventi a cui lo User Group ha partecipato o partecipera'  Parlano (speriamo bene:-)) di noi...

La nuova rivoluzione della comunicazione? La tua voce.


Primi passi verso VoiceXML 3.0
di Fabrizio Gramuglio e Salvatore Zita


Un primo assaggio di quello che potrà essere il VoiceXML 3.0 ci è offerto dall’azienda Voxpilot (http://www.voxpilot.com) che incorpora nella propria piattaforma (Open Media Platform) la possibilità di riprodurre video.
Voxpilot Open Media Platform è una piattaforma per lo sviluppo e la gestione di avanzati servizi telefonici e di comunicazione in genere, che sfrutta le potenzialità del linguaggio VoiceXML. Voxpilot Open Media Platform 3.0 punta su due aspetti innovativi che premono sempre più nell'ambiente delle telecomunicazioni: la convergenza verso un'unica rete, la rete IP, e lo sviluppo di servizi multimediali audio-video. Tale piattaforma può difatti essere utilizzata sia per servizi riguardanti la tradizionale rete telefonica PSTN sia per creare servizi su VoIP; cioè è in grado di gestire anche servizi per comunicazioni sulla rete IP.
L'architettura è modulare ed è composta da due moduli fondamentali: un Call Server e un VoiceXML Media Server, quest'ultimo dialoga con ASR e TTS attraverso il protocollo MRCP.Il Call Server è interfacciato con la rete d'accesso che utilizza l'utente per usufruire del servizio che può essere la rete PSTN se si utilizza un telefono fisso, la rete PLMN se si utilizza un dispositivo mobile, ovvero la rete IP se si sceglie di accedere attraverso Internet con VoIP. Dall'altro lato comunica attraverso il protocollo SIP con il VoiceXML Media Server. Entrambi questi due blocchi riescono a gestire non solo il trasferimento di segnali audio ma anche di quelli audio-video, difatti la piattaforma di Voxpilot riesce ad amministrare applicazioni video e servizi multimediali come la registrazione e il playback di filmati. Questa integrazione rappresenta un significativo passo in avanti verso la convergenza tra sistemi audio e sistemi video, ed apre ulteriori possibilità allo sviluppo di applicazioni per il mercato della telefonia mobile.
Un esempio di questa estensione del canale voce è visibile effettuando una video chiamata ad un servizio demo della Universal Music (+33 1 69 75 78 22) in lingua inglese.


Come funziona: un po' di codice.

La possibilità di riprodurre video all’interno del VoiceXML è gestito come un canale aggiuntivo all’interno del dialogo tra utente e computer. Voxpilot ha reso l’utilizzo del canale video molto semplice per i programmatori, infatti, senza alterare minimamente le logiche del VoiceXML 2.0 è sufficiente agire sui tag <audio>, <record> e <submit>, e sostituire i semplici file audio con file di tipo 3GP.
I formati video ad oggi supportati sono i seguenti:

  • video/3gpp (MPEG-4, AAC audio, H.263 video, AMR audio) [3GPP File Format]
  • audio/3gpp (AMR audio) [3GPP File Format]
  • video/mp4 (MPEG-4) [MP4 File Format]
  • audio/mp4 (MPEG-4) [MP4 File Format]
Gli elementi chiave per aggiungere il video alla voce sono <audio> e <record> poiché questi sulla piattaforma di Voxpilot funzionano non solo con sorgenti di tipo voce ma anche con veri e propri video. Se il device che processa l'applicazione ha gli strumenti necessari per gestire questi video, l'applicazione da vocale diventa video+voce.
Due soli elementi per un intero linguaggio non è molto, segno che si sta cercando di non introdurre alternative non standard al VoiceXML 2.1 in attesa dell’ormai prossimo VoiceXML 3.0.