La conversazione con le macchine fino ad oggi è stata poco soddisfacente: voci nasali e metalliche che spesso non rispondono a tono e ripetono le stesse frasi standard come un disco rotto. Da Siri a Cortana, da Alexa a Wavenet, gli interlocutori digitali hanno tutti gli stessi difetti. Google Duplex, il nuovo nato di Google Assistant, che dovrebbe essere disponibile in 80 Paesi e 30 lingue entro la fine dell’anno, ci permetterà di superare tutto ciò, grazie a una tecnologia molto più sofisticata di intelligenza artificiale, in grado d’intrattenere una conversazione telefonica mirata senza farsi riconoscere dall’interlocutore come una voce artificiale.

Google Duplex non sarà in grado di telefonare alla mamma per avere sue notizie o di gestire una rottura con la fidanzata, come si è subito ipotizzato dopo la prima presentazione pubblica il mese scorso, ma dovrebbe riuscire a prenotare un tavolo al ristorante o una seduta dal parrucchiere in maniera del tutto naturale, a giudicare dal test. Un salto enorme, che è stato conseguito grazie alla human-centered research. Equipaggiato con diverse voci, uomini e donne, l’assistente ha fissato un appuntamento con il parrucchiere dal vivo durante la sua presentazione, permettendosi di rispondere “Mm-hum” quando si propone di aspettare, dimostrando uno straordinario tempismo e una sorprendente capacità di riprodurre le reazioni umane.

Per arrivare a questo risultato, Google spiega che Duplez consiste in una forma di intelligenza artificiale basata su una rete neurale, ovvero un modello costituito da neuroni artificiali che riproducono l’attività delle connessioni neurali reali, quelle proprie dell’essere umano. I suoi sviluppatori quindi l’hanno addestrato come avrebbero fatto con un essere umano, guidandolo a riconoscere alcune frasi standard, le parole chiave, il ritmo, l’intonazione della discussione e soprattutto il contesto della situazione. Una volta compreso il messaggio, l’intelligenza artificiale deve rispondere. Quindi attivare due strumenti di sintesi vocale. Come primo passo, entra in gioco un motore di sintesi vocale concatenativo Text to speech, che ha il compito di formulare una risposta e leggerla a voce alta. Una volta fatto questo, il secondo strumento analizza il contesto e controlla l’intonazione. Un sistema che sembra funzionare perfettamente, date le dimostrazioni.

Resta da vedere se gli interlocutori di questo nuovo assistente vocale saranno consapevoli di parlare con una macchina. Molti internauti hanno considerato la dimostrazione talmente convincente da manifestare l’opinione che Duplex potrebbe superare il test di Turing. Da qui le polemiche: l’idea di non sapere se stai parlando con un computer o una persona reale è molto inquietante. Per Google, questa paura non ha motivo, perché gli interlocutori saranno sempre informati che la chiamata è con Google Assistant. “Comprendiamo e apprezziamo la discussione su Google Duplex, ma come detto all’inizio, la trasparenza su questa tecnologia è importante”, ha affermato un portavoce della società. “Abbiamo concepito questa funzionalità con un sistema che annuncia chiaramente che si tratta di una macchina e faremo in modo che l’interlocutore identifichi con chi sta parlando”. Nel frattempo, una fase di test della versione inglese rivolta principalmente ai professionisti e alle piccole imprese è già in corso. Tempi duri per le segretarie.