VoiceXML Italian User Group

Home page  VoiceXML Links  VoiceXML Tutorial  News dai Working Groups Voice Browser e Multimodal Interaction del World Wide Web Consortium  Articoli  Accessibilita' del web mediante la voce

Libri Voice & Speech technologies  La nostra Newsletter  Il nostro Forum  Contatti  Gli eventi a cui lo User Group ha partecipato o partecipera'  Parlano (speriamo bene:-)) di noi...

La nuova rivoluzione della comunicazione? La tua voce.



Google Voice Search
di Christian Lacetera


Da qualche mese Google sta sperimentando un nuovo servizio, che permette la ricerca di contenuti attraverso una semplice telefonata. il servizio, utilizzabile solo negli USA è raggiungibile all' indirizzo http://labs1.google.com/gvs.html

Provare la demo è molto semplice, basta aprire la pagina segnalata precedentemente e cliccare sul collegamento 'Click this link' e chiamare il numero indicato sul sito: qui risponde una voce femminile che invita a pronunciare la stringa di ricerca; provando subito con la parola "KENNEDY", dopo qualche secondo la voce ci indicherà che i risultati sono pronti e come per magia il browser, aggiornando la pagina, ci mostrerà i risultati della ricerca. Carino vero?

Non è proprio magia, anche se la prima volta che si prova il servizio si ha questa impressione.
in realtà le persone che testano il servizio sono relativamente poche e così la pagina si autoaggiorna ogni n secondi e dà l'impressione di visualizzare la nostra ricerca a comando.

Nonostante questo, l'interesse per l' esperimento è notevole, da un lato per una riflessione su come trattare via voce una grande mole di dati in risposta e dall'altro per le possibili applicazioni ed implicazioni.

Per chi ha avuto modo di utilizzare le 'Google Web APIs' (un sistema per interrogare il database di google attraverso i Web Services), nasce la domanda se sia prevista un'estensione con la possibilità di utilizzare anche questa tecnologia; pensate alla possibilita' di effettuare ricerche vocali attraverso un'applet o uno script FLASH !

Secondo me la vera applicazione potrebbe essere nel mondo consumer, pensate ad esempio ad un cellulare oppure ad un navigatore satellitare d'auto: in questi ultimi anni le capacità del display e la capacità di inviare informazioni sulla rete sono aumentate in modo esponenziale, mentre non è così per le loro funzioni di input, vedi tastiere e telecomandi vari.

Prendiamo ad esempio i noti servizi di localizzazione, siamo in auto e ci serve la "solita" farmacia aperta di turno, per trovarla dobbiamo chiamare uno di questi servizi, dare le indicazioni per la ricerca, attendere il risultato e poi inserire a mano sul navigatore le informazioni che ci sono state fornite per telefono....ma vi ricordate della ricerca su Google: semplice no, basta inviare la richiesta e sul display del nostro navigatore/cellulare avremo la mappa che ci serve per raggiungere la destinazione.

Non a caso Google sta collaborando con la BMW Tedesca per un sistema simile a quanto descritto e pare che non siano i soli, anche IBM e OPERA stanno testando un prodotto che supporta lo standard Multimodale X+V ovvero la commistione del XHTML con il VoiceXML compatibile sia con i normali PC che con i Palmari Pocket PC.

Pensate alle vecchie cabine telefoniche, potrebbero diventare dei veri e propri centri di informazione per cittadini e turisti,offrendo la possibilità di dialogo in multilingua integrando le diverse tecnologie oggi presenti sul mercato.