Un computer a disposizione di un allenatore era un’utopia, nel 1973. La storia dei dati e del calcolo applicato al calcio non poteva che cominciare in un posto dove di utopia, nel 1973, se ne intendevano: l’Unione Sovietica. In quell’anno il colonnello Lobanovsky iniziò ad allenare la Dinamo Kiev, e come prima richiesta nel suo staff volle uno statistico e un computer. Di calcolatori se ne vedevano talmente pochi che il Kgb lo mise subito sotto controllo. “Tutto è un numero” profetizzava il colonnello. Addestrò la sua squadra alla ripetizione di schemi elaborati al computer. Fu il primo a introdurre il calcio totale e portò la Dinamo Kiev e la nazionale russa ai massimi livelli del calcio europeo.

Quando invece i computer erano ancora solo prototipi e i Big Data una visione fantascientifica, il ragionier Charles Reep riempiva taccuini su taccuini con i dati delle partite a cui assisteva. Quindi li elaborava, rigorosamente a mano. Cominciò nel 1950, quando durante un partita dello Swindon Town si era annoiato talmente tanto da cominciare ad annotare tutto ciò che succedeva in campo. La sua scoperta è ancora alla base di tanti sistemi di gioco: la probabilità di sbagliare un passaggio aumenta con il numero di passaggi consecutivi. Altro che “tiki-taka”, Reep dimostrò numericamente l’efficacia del contropiede: portando prima possibile la palla nell’area avversaria si massimizza il numero dei gol. Questa teoria, conosciuta come “teoria della palla lunga”, venne pubblicata sul prestigioso Journal of Royal Statistical Society e ha ispirato più o meno tutto il calcio inglese dagli anni ’60 in poi.

Il frutto più recente della rivoluzione dei dati è il Midtjylland, squadra fondata nel 1999 e fresca vincitrice del campionato danese. L’ad della società, il 32enne Rasmus Ankersen, ha lanciato una provocazione fantascientifica: “L’algoritmo è più importante della classifica”. Il padrone del Midtjylland è Matthew Benham, uno scommettitore incallito che con i proventi delle vincite acquista squadre di calcio. La scommessa di Benham e Ankersen si è rivelata poco azzardata: il loro scouting algebrico li ha portati a selezionare i giocatori giusti durante il calciomercato, facendoli poi rendere al meglio delle loro possibilità.

I dati possono anche portare a prendere una cantonata, come successe a sir Alex Ferguson nel 2001. Le statistiche evidenziavano un calo dei tackle di Stam, suo difensore al Manchester United, perciò decise di vendere il giocatore, considerandolo in calo. Stam restò su alti livelli di rendimento per altri sei anni, prima alla Lazio e poi al Milan. Ferguson non aveva considerato il “principio di Maldini”: Paolo Maldini è stato uno dei più grandi difensori della storia pur facendo, in media, un tackle ogni due partite.

La ricerca dell’alchimia che si nasconde dietro una vittoria non poteva che affascinare anche il mondo della scienza. Undici giocatori che ne affrontano altrettanti, ognuno libero di muoversi nello spazio ma con un obiettivo comune a tutti e indipendente (o quasi) dal singolo. Una sfida, più che un problema da risolvere. Uno dei lavori più interessanti è quello di Taki e Hasegawa, con la loro definizione di ‘regione dominante’. Analizzando i dati di tracking dei giocatori, cioè la loro posizione in campo registrata ogni decimo di secondo, i giapponesi hanno elaborato un modello geometrico in grado di calcolare, ad ogni istante, l’area che un singolo giocatore può raggiungere prima di tutti gli altri. Sebbene onerosa in termini di calcolo, questa misura si è rivelata molto interessante: la strategia di attacco una squadra può essere valutata in base alla capacità di massimizzare le regioni dominanti dei suoi giocatori. Un team di ricercatori australiani guidati dal professor Horton ha invece coinvolto dieci allenatori nella costruzione di un classificatore di passaggi: ogni allenatore ha visionato e valutato una serie di passaggi (intelligente, scontato, etc); sulla base di questi giudizi è stato sviluppato un algoritmo in grado di riprodurre il ragionamento degli allenatori, automatizzando tutto il processo.

Il santo Graal della Data Science applicata al calcio è proprio la valutazione dell’intelligenza di una mossa. Quanto incide la decisione sul dove e a chi passare la palla? Quanto è efficace uno scatto in profondità o una rincorsa dell’avversario a metà campo? Il fiuto nel rispondere a queste domande è ciò che fino ad oggi ha reso grandi gli allenatori. Lo scenario sta però cambiando, e i presidenti sanno già che il loro prossimo tecnico dovrà essere anche un bravo Data Scientist.