A Parigi, l’industria dei videogame ha fatto incontrare l’accademia e l’hi-tech. Dopo quattro anni e il lavoro di centinaia di persone, il videogioco Assassin’s Creed Origins prodotto da Ubisoft non smette di far parlare di sé. Al margine del lancio è stato creato Hieroglyphics Initiative, un ambizioso progetto open source con una sola missione: creare uno strumento innovativo per tradurre i geroglifici.

Prodotto dal colosso francese del gaming Ubisoft, Assassins Creed Origins si basa su un’inedita immersione nell’Antico Egitto. Per garantire tale esperienza, Ubisoft ha chiesto aiuto all’egittologa Perrine Poiron. Ma una semplice consulenza per garantire la coerenza di date, nomi e toponimi non bastava: “Ci siamo resi conto che il sistema di traduzione dei geroglifici non è cambiato dalla scoperta della Stele di Rosetta (nel 1799, ndr). Per ricercatori non specializzati in filologia è un lavoro lungo e complesso. Ci siamo detti che bisognava creare uno strumento per facilitare la traduzione utilizzando le tecnologie di machine learning. Così, abbiamo contattato Google e Psycle”, spiega Pierre Miazga, coordinatore del progetto Hieroglyphics Initiative.

L’idea dietro questa iniziativa? Fornire una soluzione per aiutare gli egittologi a tradurre i geroglifici attraverso una piattaforma open source sfruttando le tecnologie di machine learning e dei moduli Ocr (optical character recognition, riconoscimento ottico dei caratteri).

Il mistero dei geroglifici rivelato da un algoritmo

Esperta del Terzo periodo intermedio (1070-656 a.C.), l’egittologa Perrine Poiron sottolinea la difficoltà e tutto il mistero della scrittura egizia: “I geroglifici hanno la particolarità di essere letti da destra a sinistra o da sinistra a destra, verticalmente dal basso verso l’alto e viceversa. Sono composti da fonogrammi e ideogrammi accompagnati da un sofisticato sistema di classificatori che determinano la funzione delle parole. Il contesto è spesso quello che ci permette di stabilire una struttura grammaticale o il tempo utilizzato in una frase. Anche se affascinante, la traduzione dei geroglifici è molto complessa e richiede molto tempo.”

Ed è proprio grazie allo strumento che Ubisoft sta sviluppando che i ricercatori potrebbero risparmiare molte ore di lavoro. “La tecnologia rappresenta uno strumento prezioso per gli studiosi, ma significa anche una potenziale democratizzazione del sapere che permetterà a tutti di accedere ai testi dell’Antico Egitto”, sottolinea Poiron.

La costituzioni di una database

Come funziona esattamente lo strumento che stanno mettendo a punto gli sviluppatori di Ubisoft? “Abbiamo seguito il processo degli egittologi. Prima isolano e identificano le sequenze di geroglifici delle iscrizioni, poi determinano le combinazioni e i gruppi di glifi che rappresentano le diverse parole e frasi, per poi dedurne un’interpretazione. Questo processo ci ha confrontato con numerosi ostacoli che abbiamo sistematicamente affrontato utilizzando il machine learning: l’output di ogni fase ha permesso di generare l’input per quella successiva”, spiega Alex Fry, technology director di Ubisoft.

Ma la più grande sfida riguarda il fatto che il machine learning richiede dai dati ben organizzati e categorizzati per poter generare un modello capace di replicare il pensiero di un umano. “La collezione di dati necessari non esistono per la maggior parte delle fasi del processo. Abbiamo dovuto trovare strategie per generare dei dataset da ogni tipo di fonte e input proveniente dalla comunità scientifica”, aggiunge Fry.

Per identificare e generare un database, Ubisoft ha scelto di utilizzare la classificazione Gardiner, un sistema creato dall’omonimo egittologo inglese nel 1927 che divide i geroglifici in 26 sottogruppi, per un totale di 743 caratteri.

“Abbiamo utilizzato due tipi distinti di machine learning. Il primo è il riconoscimento delle immagini per identificare i glifi di un testo e riconoscere a quali della lista Gardiner appartengono. Si tratta della stessa tecnologia legata al photo tagging o automatic captioning. Il secondo riguarda la machine translation che funziona per combinazioni di simboli, generando un’interpretazione credibile. La nostra sfida è quella di applicare queste tecniche all’universo dei geroglifici egiziani. Stiamo anche compilando un dizionario di parole per tutte le combinazioni da uno a sei glifi, e contiamo già 3mila combinazioni”.

A tre anni dal lancio della saga Assassin’s Creed, il successo di Ubisoft reinventa l’industria del gaming introducendo sempre più tecnologia, ricerca e innovazione. L’ambizione del videogame è ormai di penetrare nell’universo dell’Antico Egitto, come testimoniato dalla recente pubblicazione di The Discovery Tour. Un viaggio nel tempo emozionante in cui l’esperienza gamer lascia il posto all’esplorazione a 360 gradi.