“Città educante” è uno dei grandi progetti italiani finanziati dal Miur nei Cluster Tecnologici nazionali in cui è presente anche l’ImageLab dell’Università di Modena e Reggio Emilia per creare degli algoritmi in grado di sezionare, catalogare e archiviare secondo diverse tag i contenuti audiovisivi. Nello specifico il lavoro si serve dei video del grande archivio di Rai Educational e di Rai Teche. L’idea è quella di poter usare per ogni forma di audiovisivo algoritmi automatici che dividano il video in scene semanticamente omogenee e unità discrete. Questo significa ripensare profondamente il video come fonte e contenuto e, allo stesso tempo, ripensare gli archivi. La professoressa Cucchiara a capo del Lab modenese spiega che “così, per fare ricerche sugli audiovisivi d’archivio, io non ho bisogno di guardare tutto un video, potendo avere a disposizione una suddivisione in parti coerenti per accedere più facilmente.”

Si lavora su reti neurali create dai commenti: “La rete neurale, una volta viste tutte le immagini e imparata la notazione, riesce poi a generalizzare (concept detection), cioè estrarre alcuni caratteri specifici (feature) come forma, colore, texture e realizzare in automatico il lavoro di sezione e di nominazione. Si divide, cioè, il video in parti per facilitare l’accesso e si creano algoritmi automatici che lo dividono in scene internamente omogenee e unità discrete in modo da non aver necessità di visionarlo nella sua interezza.” In questo modo, non solo si facilità la ricerca di elementi all’interno del video, ma quest’ultimo si presta a un riuso più ampio. “Il training della Rete – ci spiega Cucchiara – è gestito da Imagenet che Stanford ha creato a mano con Mechanical Turk di Amazon. Nella fase di training faccio vedere l’immagine, gli fornisco dei concetti (cibo, museo, architettura…), la rete analizza il dato con un algoritmo di machine learning e impara come fare quel riconoscimento.”

Si possono creare, per esempio, grandi database di video educativi come ha già sperimentato il portale di Rai Scuola con i “lesson plan”, una web application dedicata agli insegnanti per fare presentazioni utilizzando il materiale degli archivi Rai. Si capisce perché i brand sono interessati a queste ricerche, come dimostra la Video Intelligence Conference che si è appena tenuta a Milano (9 aprile) indirizzata proprio alle aziende che mirano ad “accrescere la security, migliorare il marketing, ottimizzare la logistica e creare nuovi servizi con le soluzioni per la video analisi.”

E sono interessati ovviamente anche i grandi player della Ret. Le piattaforme come YouTube possono trasformarsi in archivi di nuova generazione, con possibilità di ricerca ancora più ampie. E infine i grandi broadcaster hanno fiutato l’importanza di archivi digitali sempre più specifici e aperti a forme di consultazione nuova. E proprio l’innovazione nel campo degli archivi digitali sarà il tema della Conferenza Mondiale del Fiat/Ifta (Federazione Internazionale degli Archivi Televisivi) che quest’anno si terrà a Vienna (7-10 ottobre). Gli archivi audiovisivi online giocano un ruolo fondamentale: l’Archivio Nazionale del Cinema d’Impresa, per esempio, lavora sulla catalogazione e sulla creazione di uno spazio social (il canale YouTube) in cui sia facile accedere ai contenuti, magari creando eventi come la recente pubblicazione dei materiali audiovisivi che documentano la visita di John Cage a Torino e a Ivrea nel 1984, o la celebrazione del Living Theatre proprio nei giorni della notizia della scomparsa della sua fondatrice Judith Malina. Il Bfi (British Film Institute) National Archive ha invece istituito il Colonial Film Archive dove far convergere video, film, documentari e qualsiasi altro contenuto audiovisivo inerente al periodo coloniale britannico. E sempre a proposito di archivi audiovisivi, RainventaRai è un interessante bando per la realizzazione di webserie a partire dai fondi di Teche.

Ripensare gli archivi audiovisivi magari servendosi del “deep learning” (apprendimento automatico profondo): alcuni ricercatori di Microsoft Asia hanno da poco pubblicato una ricerca a proposito del loro sistema di riconoscimento delle immagini che si è dimostrato capace di una soglia d’errore (4,94%) inferiore a quella dell’uomo (5,1%). Potremmo allora essere davvero alle soglie di un cambiamento di prospettiva nella ricerca e nel riuso, ma anche nell’indicizzazione, degli archivi audiovisivi.