Roberto Sicconi, attuale Cto della start up TeleLingo, realtà da lui co-fondata con sede a New York e focalizzata sulle tecnologie di mentoring e tutoring online, può esibire a curriculum un’esperienza importante. Unica. Quale? Quella di aver ricoperto dal 2009 al 2013, in Ibm (azienda in cui è entrato nel 1985 e che ha lasciato nel 2013), il ruolo di Program Director del progetto DeepQA (Question Answering), oggi conosciuto come Watson, coordinando le attività vocali e grafiche di visualizzazione dell’avatar del supercomputer più famoso e incensato del pianeta. L’obiettivo era quello di applicare tecniche di analisi semantica a sorgenti di informazioni non strutturate di grandi dimensioni e tecniche di scoring per valutare e prioritizzare i risultati in modo automatico. Il sistema nato da questa attività di ricerca ha conosciuto la notorietà con il quiz Jeopardy, appuntamento in cui Watson ha dimostrato per la prima volta, pubblicamente, le sue capacità di interpretare domande complesse e di rispondere allo stesso livello (anzi meglio) delle migliori intelligenze umane.

 

É stato un percorso di sviluppo tutto rose e fiori? No. Ed è lo stesso Sicconi a confessarlo a Nòva, ricordando innanzitutto la genesi del progetto: “è partito nel 2007 con l’ambizione di dimostrare al mondo scientifico i progressi fatti nell’elaborazione del linguaggio naturale tramite computer e di poter pensare, finalmente, di estendere l’uso di macchine per loro natura deterministiche all’analisi di testi, concetti e significati, capacità fino ad allora riservate all’intelletto umano”. La sfida di Jeopardy ha alzato ulteriormente l’asticella delle ambizioni e ha messo il ricercatore italiano e il suo gruppo di lavoro davanti a una serie di criticità da assolvere, “in una corsa contro il tempo per migliorare architettura, prestazioni, algoritmi, robustezza del sistema e scelta delle sorgenti di informazioni”.

 

“Credo di poter dire – ricorda ancora Sicconi – che nessuno di noi fosse certo del risultato fino al giorno della sfida. Il rischio di bachi inaspettati, domande su dominii mai incontrati prima e possibili defaillance della strategia di gioco con errori nella valutazione delle cifre scommesse in funzione del grado di confidenza nel dominio hanno messo sotto enorme pressione l’intero team negli ultimi mesi del 2010”. Com’è andata è storia. Watson ha sbaragliato la concorrenza (inizio 2011) e iniziato da lì in avanti il suo percorso applicativo in campi, a cominciare dalla medicina, dove le sue capacità cognitive hanno generato risultati estremamente significativi. Ma fin dove può arrivare la sua intelligenza?

 

“Watson – ci spiega Sicconi – applica modelli statistici alla valutazione di ipotesi formulate per interpretare il testo da analizzare, per decidere le interpretazioni più probabili e poi fornirle corredate del grado di confidenza associato. Il livello di confidenza e quindi la qualità dell’interpretazione dipendono dalle dimensioni del dominio, dalla quantità e qualità delle sorgenti di dati utilizzate per istruire il supercomputer, dalla robustezza degli algoritmi incaricati di identificare caratteristiche e pattern nel testo, dallo sforzo profuso per raffinare modelli e testarli su domande e risposte di riferimento”. Tradotto in concreto, allo stato attuale Watson non è in grado di “comprendere” il significato di una frase come possono fare gli essere umani senza fare troppa fatica. Ma è in grado di trovare esempi di significati simili, di valutarne la “distanza” e corredarla del livello di confidenza necessario per decidere quali significati siano affidabili oltre una soglia predefinita e quindi attendibili. La macchina, in altre parole, apprende a ciclo continuo e non a caso Sicconi la etichetta come “una piattaforma in costante evoluzione più che una soluzione a se stante e stabile nel tempo”. Watson rappresenta di fatto una pietra miliare nello sviluppo di sistemi di autoapprendimento avanzati il cui fine è quello di rendere l’interazione fra uomo e macchina sempre più ricca, flessibile ed efficace.

 

L’evoluzione delle tecnologie di riconoscimento e interazione vocale è forse l’aspetto più interessante del progetto nato nei laboratori di Ibm. “Per vincere la sfida di Jeopardy – dice Sicconi – l’aspetto più critico è stato quello di sintetizzare la produzione delle risposte con la massima qualità possibile avendo da gestire milioni di parole, in diverse lingue e non solo in inglese, evitando errori di pronuncia che avrebbero invalidato le risposte. Su questo aspetto un team di diversi esperti di sintesi vocale ha lavorato per circa un anno, raffinando un software già particolarmente avanzato”. E guardando ai lavori in corso in casa Apple (Siri) o Google (Now)? L’ex Program Director di Watson giudica estremamente interessante” la rapida evoluzione di questi sistemi di interazione vocale, prima sui cellulari e ora anche nelle auto e sui pc desktop.

 

“Per quanto ancora imperfetto, il riconoscimento vocale ha fatto enormi progressi negli ultimi anni e secondo me passerà da soluzioni di nicchia ad accettabilità estesa nel giro di qualche anno. Quello che ancora manca è la definizione e la diffusione di standard di compatibilità nell’interpretazione dei comandi, che rendono dispositivi diversi in grado di gestire un linguaggio condiviso”. Nel contempo – chiude il cerchio Sicconi – sistemi intelligenti di gestione del dialogo stanno aprendo la possibilità di guidare utenti non esperti nella navigazione delle informazioni disponibili. Cosa significa questo per i comuni consumatori? Presto detto. Macchine come Watson possono fornire la classica marcia in più nell’interpretare quello che l’utente ha in mente e sta cercando di comunicare. “A livello personale – ci confida infine uno dei papà del supercomputer di Ibm – mi capita sempre più spesso di utilizzare soluzioni hands-free (senza mani, ndr) sul cellulare per la ricerca di informazione, l’impostazione di comandi, le dettatura di messaggi, trovandole decisamente più efficienti dell’uso di una tastiera, specie se virtuale e specie se ci si trova in movimento”. E non a caso Big Blue sta spingendo sull’acceleratore per offrire agli sviluppatori appositi strumenti (sottoforma di Api, Application programming interface) per scrivere app capaci di attingere alle doti di riconoscimento del linguaggio naturale e di analisi predittiva di Watson.