La criminalità funziona come i terremoti. E’ complesso stabilire quando avverrà la prima scossa, ma quelle di assestamento sono prevedibili. O almeno è quello che sostiene Florian Gauthier, giovane data scientist di Etalab, la prima cellula dell’amministrazione francese che mette i big data al servizio delle autorità pubbliche.

“Un giorno la polizia è venuta a bussare alla porta e ci ha detto: “Abbiamo molti dati ma non sappiamo utilizzarli, ci date una mano?”, spiega Florian Gauthier mentre cerca la presentazione giusta tra i mille documenti che defilano sul laptop. Fa parte di un piccolo gruppo di data scientist che formano Etalab, la cellula esperta in big data che il governo francese mette al servizio dell’amministrazione pubblica dal 2011. Al terzo piano della torre Mirabeau, nell’Ovest parigino a qualche passo dalla Senna, questo team di sviluppatori ha la missione di garantire e facilitare la trasparenza dei dati pubblici attraverso la piattaforma data.gouv.fr e di costruire nuovi strumenti per sveltire i processi della burocrazia.

Guardie e ladri

Quando la polizia ha bussato alla porta, la tentazione di incrociare le competenze degli ingegneri con quelle degli investigatori è stata forte. L’ambizione? Costruire Predvol, un sistema capace di determinare la zona  in cui avrà luogo il furto di una macchina attraverso gli algoritmi predittivi. Insomma, predire il futuro e anticipare le mosse dei ladri. “Attenzione, non parliamo di sfere di cristallo, ma di indovinare un fatto futuro a partire da elementi del passato, minimizzando l’errore attraverso il machine learning”.

Nella pratica, i giovani ingegneri hanno raccolto tutti i dati della regione dell’hinterland parigino in cui si verificano più furti d’auto, l’Oise. Si tratta della zona a ovest della capitale in cui atterrano i voli di Ryanair, a Beauvais: “Quando abbiamo iniziato la collaborazione, la polizia locale registrava i luoghi in cui si verificavano dei furti con delle puntine metalliche piantate su una carta geografica appesa al muro” sottolinea Florian. Questa massa di dati ha permesso di creare un grande database : “Facendo numerosi test, siamo riusciti a individuare dei modelli, delle sequenze che si ripetevano”. Questi algoritmi, sviluppati a partire dai furti avvenuti, sono stati in seguito testati su dati nuovi, mai analizzati, per capire se l’algoritmo era capace di determinare i luoghi in cui si sarebbero verificati furti di auto.

Un sillogismo sismico

I risultati di questo esperimento dimostrano che i luoghi soggetti a più furti sono destinati a subire altri furti. Un risultato sillogistico – per il quale non sarebbe stato necessario ricorrere a big data e machine learning ? – che viene sostenuto dalla teoria del sismologo francese David Marsan secondo il quale nelle zone in cui si verificano dei terremoti, è più probabile che se ne verifichino altri. Senza paura, possiamo riassumere il tutto con il vecchio adagio: non c’è due senza tre.

Questo approccio si ispira anche alla “broken windows theory” (la teoria delle finestre rotte) pubblicata sulla rivista The Atlantic nel 1982. Gli autori, James Q. Wilson e George L. Kelling, sostengono infatti che se le finestre rotte di un edificio non vengono riparate, la probabilità che dei vandali ne rompano altre, è più alta.

Un fallimento è un successo

Dopo mesi di lavoro dietro il suo computer, Florian ha accompagnato una pattuglia della polizia per le strade di Beauvais : “Grazie al nostro lavoro, i poliziotti potevano osservare sull’iPad i diversi tipi di quartiere, i furti commessi nella zona negli ultimi giorni o settimane, e le proiezioni per la notte”. Nella scienza, ma soprattutto nella pubblica amministrazione, un fallimento può corrispondere a un successo: oggi il team di Etalab ha sviluppato un sistema incapace di predire il futuro, ma che è sicuramente più performante delle puntine piantate su una carta della città.

Quest’esperienza ha anche dimostrato al team di data scientist la distanza tra autorità pubbliche e lavoro quotidiano: “Stavamo costruendo un aereo per persone che non avevano mai guidato una macchina”, commenta Florian sottolineando l’importanza di lavorare sempre con un approccio bottom-up includendo da subito i bisogni dell’utenza finale.

Oggi il team lavora su Signaux faibles, un sistema di algoritmi predittivi che permette d’identificare le aziende che sono sull’orlo del fallimento per poterle sostenere ed evitare la bancarotta, e su La Bonne Boîte, un sistema che determina il momento ideale per inviare una candidatura spontanea a un’azienda (calcolando che in Francia il 70% delle offerte di lavoro non vengono pubblicate).