venerdì, Novembre 15

Il Data Scientist e la “nuova era” dei Big Data

0

Sembra strano dirlo, ma nel nostro presente si stanno formando i professionisti dei mestieri del futuro. Uno di questi? Senza dubbio il “data scientist”. Le grandi potenzialità dei Big Data, insieme ai dubbi sull’etica e sulla privacy, sono state confermate più volte negli ultimi anni, fino ad essere discusse nel corso del G7 delle Accademie tenutosi quest’anno in Italia.  Lo scienziato dei dati è una figura professionale estremamente duttile e potenzialmente attiva in ogni campo che lavora attraverso l’estrapolazione dei Big Data, la loro elaborazione e, in ultimo, la produzione di nuova conoscenza.

Da anni lavorano alla formazione degli scienziati dei dati le istituzioni accademiche toscane che, da pochi mesi, hanno annunciato l’istituzione del Corso di Dottorato (Ph.D) in Data Science. Scuola Normale, Università di Pisa, Scuola Sant’Anna, Scuola Imt Alti Studi Lucca e Cnr rilasceranno il massimo titolo accademico universitario, il diploma internazionale di Ph.D (equivalente a quello italiano di Dottore di Ricerca) nella disciplina che studia i “Big Data” e l’impatto che la “Data Science” ha sulla società e sulla scienza nel suo complesso. Otto il numero di posti messi a concorso per l’anno accademico 2017/2018, che avrà inizio il primo novembre; tre gli anni di durata del corso.

Abbiamo intervistato il prof. Dino Pedreschi, coordinatore del Dottorato e professore di Informatica all’Università di Pisa, per capire meglio quali saranno i risvolti di questa nuova figura professionale “ibrida”.

 Chi è il data scientist, professionista “ibrido” un po’ informatico, statistico e narratore?

Sì, diciamo che queste sono “le tre teste della chimera”. Tutto nasce dal cambiamento che sta subendo la professione dello statistico: una volta, per comprendere meglio certe tendenze in ambito politico o culturale, ad esempio, bisognava svolgere una indagine campionaria, intervistare un certo numero di persone, raccogliere i dati e in ultimo interpretarli, rispondendo a quelle ipotesi che lo statistico aveva elaborato prima di iniziare la sua ricerca. Oggi il percorso è diametralmente opposto: i dati arrivano “spontaneamente” attraverso i sistemi digitali che utilizziamo, non sulla base di sondaggi realizzati ad hoc, rispondendo a domande preconfezionate; si tratta di dati complessi, che parlano di noi, dei nostri desideri, comportamenti, scelte, opinioni, viaggi. La domanda che ci si è posti è stata: come trasformare questi dati in senso? Come renderli informazioni interessanti, senza avere ipotesi di partenza o domande di ricerca formulate a monte? Ecco che arrivo a rispondere alla sua domanda: la figura professionale che andremo a formare avrà sicuramente le competenze di uno statistico, dunque saper gestire e trattare questa grande quantità di dati attraverso le più innovative strumentazioni tecnologiche ma, allo stesso tempo, saper estrapolare da quei dati non solo le risposte a domande già formulate, ma anche domande inedite emerse dai dati stessi. “Dare senso” ai dati investe una dimensione che va oltre quella esclusivamente statistica tradizionale. Ecco perché c’è bisogno di competenze nuove dal punto di vista statistico unite alla capacità di raccontare, attraverso linguaggi diversi, questo bagaglio di conoscenza nascosto tra i dati: il data scientist deve essere in grado, in poche parole, di rendere comprensibile (e fruibile) per tutti ciò che ha riscontrato nell’elaborazione dei Big Data.

A cosa serve lo studio dei dati? Concretamente quali saranno i vantaggi nel formare questa nuova figura professionale?

Potenzialmente i vantaggi sono infiniti. Le applicazioni di questa nuova professione andranno ad interessare qualunque ambito scientifico e produttivo. Faccio un esempio, la salute: i dati di comportamento quotidiano, su quanto ci muoviamo o cosa mangiamo, uniti a quelli prodotti in ambito medico possono portare, ad esempio, alla creazione di trattamenti personalizzati che rispondano in modo più efficace ai problemi di salute. Pensiamo anche ai dati sui trasporti e la mobilità: potrebbero aiutare a migliorare la sinergia tra uomo e città, diminuendo il traffico, la quantità di inquinamento e di conseguenza il livello di qualità della vita. In questi ed in molti altri ambiti è possibile pensare ad applicazioni del genere che non solo sono di interesse scientifico, ma anche applicazione pratica ed industriale nei contesti più disparati.

Il trattamento dei dati, frammenti di noi che disperdiamo ogni giorno, ha anche un risvolto etico. Come si approccia il corso a questo aspetto?

Nei nostri progetti e nella nostra didattica abbiamo sempre conservato un approccio in cui l’etica non è nelle retrovie ma si presenta come parte fondamentale. Gran parte dei dati che vengono prodotti ogni giorno raccontano storie personali, intime. Tuttavia il problema è più complesso: non si tratta soltanto di tutelare la privacy dei singoli, ma impedire che la mole di dati e le conoscenze da essa estrapolate possano essere utilizzate in modo negativo, per scopi appunto “non etici”. Le faccio un esempio: è plausibile pensare, attraverso l’analisi dei dati, di individuare sui social i soggetti più influenzabili nelle scelte politiche e manipolare le loro menti verso un determinato candidato in campagna elettorale; allo stesso modo quegli stessi dati possono essere utilizzati per comprendere le lacune dei cittadini in termini di consapevolezza politica ed intervenire per colmarle, favorendo il dibattito democratico e la formazione di opinioni coscienti. È una questione di utilizzo etico dei dati.

In un certo senso verrebbero messi al servizio del “pubblico” quei dati che fino ad adesso erano stati di pochi?

Questo è un altro ottimo punto su cui discutere. Da parte nostra, siamo pronti ad inaugurare una “seconda epoca” della Data Science. I Big Data sono nati in mano alle grandi aziende digitali con la loro enorme capacità di aggregazione delle informazioni, utilizzate per scopi di carattere prevalentemente commerciali. Tuttavia pensare che i dati debbano essere utilizzati da pochissimi e solo per ragioni pubblicitarie, per quanto legittime, è davvero uno spreco. A questo punto è importante mettere questi dati, attraverso modalità etiche, corrette e verificabili, a servizio della collettività e della scienza. Si tratta di una tendenza concreta, dimostrata anche dal G7 delle Accademie di quest’anno, in cui per la prima volta si è parlato di Data Science come fattore preponderante dello sviluppo sostenibile in tutti i settori. Il nostro dottorato si propone anche di influenzare ed agevolare questo cambiamento di punto di vista in cui i dati vengono visti come possibilità concreta di miglioramento della qualità di vita di ognuno di noi.

Possiamo considerare questa una professione del futuro?

Il data scientist è una professione del futuro. A proposito le cito un’altra fonte autorevole, il World Economic Forum, che ha fatto una grande indagine a livello globale su tutti i settori produttivi; ne è emerso che la figura professionale del data scientist è l’unica prevista in forte aumento nei prossimi anni, ovunque nel mondo ed in tutti i settori dell’industria, dei servizi e della pubblica amministrazione. Senza dubbio si tratta di un nuovo mestiere in cui tutto il mondo nutre grandi aspettative.

Il dottorato è il primo emanato in Italia (in contemporanea con l’Università di Bologna): quanto pensa sia “aggiornata” l’università italiana rispetto alle professioni del futuro?

Dal punto di vista della ricerca e della sperimentazione didattica non siamo messi male qui in Italia rispetto al resto del mondo. Si è fatto poco e si fa ancora poco, a mio avviso, ma in linea con gli standard europei e mondiali. Il gruppo di intesa che sta dietro a questo dottorato è lo stesso che ha dato vita alla prima laurea europea in Data Science (che esiste dal 2002), così come il Master di II livello in Big Data (dal 2014). Quindi azzarderei dire che, qui in Toscana, siamo stati abbastanza precursori su questi temi. Nel complesso, non penso che l’Università abbia fatto abbastanza. C’è da dire che, in Italia come all’estero, questo tipo di approccio interdisciplinare non è facile da realizzare: le Università sono organizzate in Dipartimenti, per disciplina, e questo non facilita il dialogo tra ambiti diversi e apparentemente scollegati. Un altro ruolo che la Data Science avrà in futuro è proprio quello di “accorciare le distanze” tra le discipline: essendo per natura interdisciplinare, ha dato e darà luogo a collaborazioni inedite fra scienziati che fino ad allora non avranno avuto nulla in comune.

Come è nata questa “intesa” tra cinque istituzioni accademiche? Come gioverà questo sforzo collaborativo alla qualità del dottorato?

La collaborazione tra istituzioni accademiche era già nata precedentemente grazie a gruppi di ricerca e diversi partner che da anni fanno progetti europei insieme e hanno dal 2013 dato vita ad una infrastruttura di ricerca europea, SoBigData.eu, una sorta di CERN della Data Science: è un luogo sia fisico (in giro per l’Europa), sia virtuale, che permette di fare ricerche e sperimentazioni alla base di grandi progetti. Le iniziative didattiche nascono da questa “base”: su questa rete, toscana ma anche italiana ed europea, i nostri dottorandi troveranno i laboratori e le competenze adatte a sviluppare i propri progetti di ricerca. Teniamo molto al fatto che i nostri futuri dottori di ricerca contribuiscano all’innovazione sociale e portino la data science e i suoi benefici nella vita concreta delle persone.

A chi è rivolto questo dottorato? Quali devono essere le caratteristiche del candidato ideale? 

Chiunque. Non ci sono sbarramenti all’entrata dovuti al tipo di laurea magistrale conseguita. Quello che noi ci aspettiamo dai candidati di successo è una grande motivazione e passione personale collegata agli aspetti quantitativi dei propri ambiti di studio; allo stesso tempo ci aspettiamo una grande voglia e creatività nello sviluppare nuove idee e nuovi progetti sulla base delle competenze già acquisite e quelle date da noi, ovvero predisporre di una grande quantità di informazioni provenienti dalle fonti più disparate e la capacità di processarle e trasformarle in senso.

L’informazione che non paghi per avere, qualcuno paga perché Ti venga data.

Hai mai trovato qualcuno che ti paga la retta dell’asilo di tuo figlio? O le bollette di gas, luce, telefono? Io no. Chiediti perché c’è, invece, chi ti paga il costo di produzione dell'Informazione che consumi.

Un’informazione che altri pagano perché ti venga data: non è sotto il Tuo controllo, è potenzialmente inquinata, non è tracciata, non è garantita, e, alla fine, non è Informazione, è pubblicità o, peggio, imbonimento.

L’Informazione deve tornare sotto il controllo del Lettore.
Pagare il costo di produzione dell’informazione è un Tuo diritto.
"L’Indro" vuole che il Lettore si riappropri del diritto di conoscere, del diritto all’informazione, del diritto di pagare l’informazione che consuma.

Pagare il costo di produzione dell’informazione, dobbiamo esserne consapevoli, è un diritto. E’ il solo modo per accedere a informazione di qualità e al controllo diretto della qualità che ci entra dentro.

In molti ti chiedono di donare per sostenerli.

Noi no.

Non ti chiediamo di donare, ti chiediamo di pretendere che i giornalisti di questa testata siano al Tuo servizio, che ti servano Informazione.

Se, come noi, credi che l’informazione che consumiamo è alla base della salute del nostro futuro, allora entra.

Entra nel club L'Indro con la nostra Membership

Commenti

Condividi.

Sull'autore