Primi passi verso VoiceXML 3.0 di Fabrizio Gramuglio e Salvatore Zita
Un primo assaggio di quello che potrà essere il VoiceXML 3.0 ci è offerto dallazienda Voxpilot
(http://www.voxpilot.com)
che incorpora nella propria piattaforma (Open Media Platform) la possibilità di riprodurre video.
Voxpilot Open Media Platform è una piattaforma per lo sviluppo e la gestione di avanzati servizi telefonici e di comunicazione in genere, che sfrutta le potenzialità del linguaggio VoiceXML. Voxpilot Open Media Platform 3.0 punta su due aspetti innovativi che premono sempre più nell'ambiente delle telecomunicazioni: la convergenza verso un'unica rete, la rete IP, e lo sviluppo di servizi multimediali audio-video.
Tale piattaforma può difatti essere utilizzata sia per servizi riguardanti la tradizionale rete telefonica PSTN sia per creare servizi su VoIP; cioè è in grado di gestire anche servizi per comunicazioni sulla rete IP.
L'architettura è modulare ed è composta da due moduli fondamentali: un Call Server e un VoiceXML Media Server, quest'ultimo dialoga con ASR e TTS attraverso il protocollo MRCP.Il Call Server è interfacciato con la rete d'accesso che utilizza l'utente per usufruire del servizio che può essere la rete PSTN se si utilizza un telefono fisso, la rete PLMN se si utilizza un dispositivo mobile, ovvero la rete IP se si sceglie di accedere attraverso Internet con VoIP. Dall'altro lato comunica attraverso il protocollo SIP con il VoiceXML Media Server.
Entrambi questi due blocchi riescono a gestire non solo il trasferimento di segnali audio ma anche di quelli audio-video, difatti la piattaforma di Voxpilot riesce ad amministrare applicazioni video e servizi multimediali come la registrazione e il playback di filmati.
Questa integrazione rappresenta un significativo passo in avanti verso la convergenza tra sistemi audio e sistemi video, ed apre ulteriori possibilità allo sviluppo di applicazioni per il mercato della telefonia mobile.
Un esempio di questa estensione del canale voce è visibile effettuando una video chiamata ad un servizio demo della Universal Music (+33 1 69 75 78 22) in lingua inglese.
Come funziona: un po' di codice.
La possibilità di riprodurre video allinterno del VoiceXML è gestito come un canale aggiuntivo allinterno del dialogo tra utente e computer. Voxpilot ha reso lutilizzo del canale video molto semplice per i programmatori, infatti, senza alterare minimamente le logiche del VoiceXML 2.0 è sufficiente agire sui tag <audio>, <record> e <submit>, e sostituire i semplici file audio con file di tipo 3GP.
I formati video ad oggi supportati sono i seguenti:
- video/3gpp (MPEG-4, AAC audio, H.263 video, AMR audio) [3GPP File Format]
- audio/3gpp (AMR audio) [3GPP File Format]
- video/mp4 (MPEG-4) [MP4 File Format]
- audio/mp4 (MPEG-4) [MP4 File Format]
Gli elementi chiave per aggiungere il video alla voce sono <audio> e <record> poiché questi sulla piattaforma di Voxpilot funzionano non solo con sorgenti di tipo voce ma anche con veri e propri video. Se il device che processa l'applicazione ha gli strumenti necessari per gestire questi video, l'applicazione da vocale diventa video+voce.
Due soli elementi per un intero linguaggio non è molto, segno che si sta cercando di non introdurre alternative non standard al VoiceXML 2.1 in attesa dellormai prossimo VoiceXML 3.0.
|