In principio fu Wittgenstein e la somiglianza di famiglia: “Non pensare, osserva” la rete “complicata di somiglianze che si sovrappongono e si incrociano a vicenda. Somiglianze in grande e in piccolo”. La frontiera del web semantico passa (anche) da quanto si riuscirà a fare del tag oltre che una parola-etichetta una parola-nodo. Dall’occorrenza (numero di volte in cui una parola appare in un testo) alla pertinenza (la funzione che la stessa parola occupa in un contesto). Non solo quanto, ma dove.

Per gli esperti, è il clustering, l’analisi multivariata dei dati che consente di raggrupparli a seconda della loro distanza reciproca. Anzi, tecnicamente, di aggregarli. «Il nostro algoritmo ci dà una pertinenza maggiore dell’80%», afferma Patrick Lardi di Newscron, l’applicazione aggregatrice di notizie online nata da un progetto di ricerca del Politecnico di Zurigo e basata, appunto, sul clustering multilingue.

I tre co-fondatori di Newscon: da sinistra, Elia Palme, Roberto Prato e Patrick Lardi
I tre co-fondatori di Newscon: da sinistra, Elia Palme, Roberto Prato e Patrick Lardi

«Cerchiamo di bilanciare la data di uscita con il numero di letture e condivisioni degli utenti», ma la formula è top secret. Di certo, l’aggregazione per tag con particolare riguardo al paratesto permette di far apparire in home un solo articolo tra quelli simili e di categorizzare gli altri mantenendoli a disposizione dell’utente. Facile quindi incrociare le fonti, nonché notare quante volte la stessa notizia sia stata ripresa dai diversi giornali: «Nel 2013, su 400 milioni di articoli presi in esame, i doppioni erano il 15,21%, gli aggregati il 50,42%, gli unici il 34,37%». Un indicatore di status dell’ecosistema dell’informazione?

Un contenuto aggregabile su due suppone una distanza tra le notizie piuttosto breve. Se l’information overload è un problema di filtri (Shirky docet), Newscron ne offre a sufficienza: quantitativi, tematici, geografici (si punta molto sul glocal, «perché Flipboard non arriverà mai a coprire il paesino con pochi abitanti») nonché, nelle versioni a pagamento, possibilità di “bannare” fino a cinque giornali indesiderati. Un paradosso, per chi si propone di “rimuovere i paraocchi durante la lettura delle notizie”? In attesa di capire come risponderà il mondo dell’editoria (l’app è stata presentata al Salone del Libro di Torino con un modello di business centrato sul revenue sharing), è interessante notare come Newscron riproponga la questione del complesso rapporto tra informazione, ridondanza, rumore, che molto dipende dalla posizione (orizzonte di senso) del lettore, da cui scaturisce la pertinenza della notizia. Il clustering dell’algoritmo si incrocia necessariamente con quello neurale che, seguendo Poggio e Girosi, procede per approssimazioni.

Il gioco delle somiglianze e differenze è continuo, insieme analogico e digitale. La notizia (im)pertinente, etimologicamente ci riguarda. Ci appartiene. Purchè la si metta a fuoco.