Facebook ha ceduto i big data all’università di Pavia. In anonimato, garantendo la privacy. Un docente dell’università di Pavia ha una sua analisi svolta su dati anonimizzati forniti da Facebook. Tim, Vodafone, Wind Tre e Fastweb, dal canto loro, hanno offerto aggregati di dati anonimi che aggregano gli spostamenti dei propri utenti per fare contact tracing, ossia rintracciare tutti i contatti di una persona contagiata, o altre forme di monitoraggio.
Tra le prime ricerche che la task force prenderà in esame ce n’è una basata su dati di Facebook. Il social network ha fornito informazioni aggregate e anonimizzate all’università di Pavia, che ha elaborato alcune proiezioni. Lo scambio è avvenuto all’interno del programma Data for Good, sponsorizzato dallo stesso patron dell’azienda, Mark Zuckerberg, tra le iniziative di contrasto al contagio.
Menlo Park ha messo a disposizione data set utili alle università per studiare la diffusione del coronavirus, che comprendono, come afferma lo stesso fondatore del social network, “dati sulla mobilità e mappe sulla densità della popolazione”.
“Il progetto Data for Good di Facebook consente a ricercatori e organizzazioni non profit di analizzare trend aggregati, anonimi e non identificabili di mobilità per capire come una malattia potrebbe diffondersi. I dati aggregati sulla mobilità possono essere utili durante catastrofi naturali, per capire se le popolazioni stanno evacuando o ci sono sfollati, oppure durante delle epidemie, dove possono rappresentare uno strumento utile per prevedere lo sviluppo della malattia stessa”.
Il programma aggrega dati pubblici e altri in mano a ricercatori sanitari e organizzazioni non-profit, che hanno sottoscritto con il colosso dei social network accordi per la licenza. In Italia, tra quelli pubblici ci sono mappe ad alta risoluzione della densità della popolazione, ottenute integrando statistiche dei censimenti e immagini satellitari, e i flussi di post pubblici sul Covid-19, diffusi su gruppi e pagine Facebook e da alcuni account di Instagram (attraverso CrowdTangle live).
Ai ricercatori sanitari dell’università di Pavia, messi in contatto con la piattaforma all’inizio di marzo dal ministero dell’Innovazione, sono stati consegnati, attraverso un contratto di licenza e accessi riservate ai database, dati aggregati sulla mobilità attraverso un programma di mappe per la prevenzione delle malattie. Questo dataset comprende anche informazioni sugli spostamenti dal Nord a Sud avvenuti nella notte tra il 7 e l’8 marzo, mentre il presidente del Consiglio, Giuseppe Conte, annunciava la chiusura della Lombardia e di 14 province tra Veneto, Emilia Romagna e Piemonte. Facebook non ha fornito dettagli in merito.
I dati però non escono, a quanto assicurano gli interessati, dal perimetro dell’ateneo. “Noi non vediamo i dati di partenza, vedremo solo i risultati dello studio”, spiega Pisano: “La salvaguardia della privacy viene prima di tutto”.
Se si pescano i dati delle comunicazioni elettroniche, che si possono usare per tracciare gli spostamenti di una persona, questi devono essere usati in forma anonima e aggregata, per produrre, per esempio, mappe aggregate sulla concentrazione degli smartphone, per misurare l’affollamento di focolai del contagio o individuare assembramenti.
Ma si può fare un tracciamento anonimo?
In un approfondito video su Youtube Flora spiega che già solo con dati anonimi delle telecomunicazioni si possono ottenere molte applicazioni: analisi di big data sul traffico, individuazione di assembramenti, messaggi a specifici utenti e geofencing (tracciare delle aree e, se vengono superate, far scattare un avvertimento). Ma anche senza cellulare, ci sono molti altri strumenti per fare monitoraggio, dai consumi energetici ai biglietti dei mezzi pubblici, dai pedaggi alla lettura delle targhe.