“Ho fatto il liceo linguistico e poi ho cambiato rotta. Quando ho deciso di frequentare ingegneria informatica all’università nessuno se lo aspettava. Ho sperimentato molto, ho fatto una tesi in robotica e poi ho trovato subito lavoro come Data Scientist. Sappiate che cambiare percorso è fattibile!”
Venerdì 10 aprile abbiamo fatto colazione online con Carolina Beretta, Data Scientist di Docebo, piattaforma e-learning su cloud, basata su Intelligenza Artificiale e disponibile anche per formazione mobile.
Se dovessi spiegarlo a una nonna, come spiegheresti cos’è la scienza dei dati?
Risolvere i problemi tramite i dati. Che problemi? Dipende da quello che vogliamo risolvere. Possiamo partire da qualcosa di molto semplice, come stimare il costo di una casa, oppure aumentare il grado di complessità: dall’analisi delle immagini, ai chatbot. Data science vuol dire risolvere un problema partendo dai dati e imparare da questi.
Cosa fa una data scientist durante il giorno? Quali sono le figure professionali con cui più interagisci nei progetti?
Il bello di questo lavoro è che ogni giorno non è uguale all’altro: ci sono giorni in cui interagisco con diverse persone che hanno background e competenze molto differenti e altri giorni in cui interagisco poco perché sono in una fase di ricerca e devo quindi leggere vari articoli che sono stati pubblicati. La fase successiva prevede sempre un momento di discussione con i colleghi per capire la strategia più giusta da seguire. Durante la parte implementativa invece mi interfaccio con figure tecniche, dal punto di vista di scrittura del codice. Durante l’identificazione del problema, invece, ci si interfaccia con i clienti esterni o interni.
Ci parli del progetto più interessante che hai seguito e che impatto ha avuto?
L’ultimo lavoro che mi ha colpito di più è un progetto di summarization: vogliamo creare dei riassunti in modo automatico partendo dai testi originali. Un progetto molto interessante dove ho imparato molto: abbiamo studiato, testato e ho messo mano a codice non scritto da me. Una volta messo in produzione potremo finalmente misurarne l’impatto. Dal punto di vista personale, al momento mi sto divertendo molto a giocare con alcuni modelli di media synthesis e di generazione randomica delle immagini.
Com’è essere una donna nella scienza dei dati? Secondo te ci sono delle differenze tra uomini e donne?
Credo che le differenze, a livello lavorativo e non solo, tra persone siano determinate da tanti fattori, ma non dal genere. Mentirei però se dicessi che non ci siano delle discrepanze. C’è sicuramente una disparità nel mondo tech, c’è poca rappresentanza femminile e questo può portare a delle discriminazioni. All’università eravamo in 200 e solo 10 donne, adesso lavoro in un team di 10 persone e sono l’unica donna. Devo dire che tutto dipende dalle persone con cui ci si interfaccia, personalmente non ho esempi negativi, anche perchè in Docebo c’è un’ottima cultura aziendale. Vedo che si sta facendo un grande lavoro per sensibilizzare il mercato e sicuramente conferenze, associazioni e community, come SheTech e Women in Machine Learning, che lavorano per ridurre questo gap, danno un grande contributo a questo cambiamento culturale.
È possibile diventare data scientist seguendo percorsi online? Ci sono dei corsi da seguire?
Dipende da cosa vuoi fare: se vuoi lavorare in un grande centro di ricerca mondiale devi avere un dottorato e un record di pubblicazioni. Se invece vuoi lavorare come data scientist all’interno dell’industria, non è strettamente necessario avere una laurea perché puoi acquisire le competenze in altri modi. Inoltre, devi studiare, essere curioso/a e fare corsi online. È fattibile ma non facile, in due settimane non diventi data scientist, ma si può fare!
Un consiglio per chi vuole diventare data scientist?
Non abbiate paura di provare, provate e riprovate! Se vi interessa il campo data science e tech in generale, iniziate a metteterci le mani!
Ecco alcune risorse consigliate da Carolina:
- http://themlbook.com/ (e-book disponibile gratuitamente)
- https://www.kaggle.com/ (contiene dataset, notebook con codice ed esempi, ed anche dei corsi)
- https://www.coursera.org/learn/machine-learning
- https://www.udacity.com/