L’apprendimento automatico, lo si capisce dalla locuzione stessa, impara dal passato, dai dati storici. Calcolare una proiezione, realizzare un modello di analisi capace di dire, per esempio, quanti casi da coronavirus potrà avere il Molise il 9 giugno 2020 non è però semplice intelligenza artificiale.
Ancora di più, non è semplice machine learning provare a ipotizzare quanti casi non identificati (perché asintomatici e non individuati come contatti di persone contagiate) ci possono essere in regione. La sezione è una delle più interessanti dei cruscotti che Engineering ha messo a disposizione sulla suite opensource Knowage.
I tecnici di Engineering stimano i positivi non individuati e pure i guariti: alla data di ieri, rispettivamente, 189 e 1.211. Ma è ben evidenziata un’avvertenza: le previsioni sono fatte a partire da dati instabili nel tempo.
«Nelle ultime settimane è cambiata, di settimana in settimana, la politica con cui si vanno a fare i tamponi. E chiaramente quella previsione – spiega a Primo Piano Grazia Cazzin, direttore Offerta Data & Analytics di Engineering – non può essere in questo momento molto attendibile. Il machine learning impara dalla storia passata. Quando c’è una storia più o meno stabile la capacità di apprendimento e quindi la proiezione è molto affidabile. In questo caso, come abbiamo visto, ogni tre giorni cambiava il ritmo, la modalità, la quantità di tamponi effettuata. Il machine learning impara un sistema instabile e il tipo di proiezione che può fare ha diversi margini di errore».
Marco Breda, come Cazzin lavora nel settore innovazione e ricerca della multinazionale ed è direttore Advanced Analytics – Data & Analytics. Aggiunge qualche dettaglio sul modello di analisi, classico, da cui si è partiti. Ci sono vari stati: suscettibili, esposti, infetti, guariti, controllati con tampone, stati attraversati dalle persone nel corso dell’epidemia. Engineering ha lavorato sul modello matematico per fare in modo che sia il più possibile simile a quello reale. Utilizzando i dati di Italia, Cina, di tutti i Paesi colpiti dalla pandemia viene fuori che ci sono tante persone infette che non vengono sottoposte a tampone. «Detto in maniera semplice, prendiamo i dati disponibili e li ‘agganciamo’ in modo ottimale al nostro modello dinamico in cui sono definite delle variabili, correggendo ulteriormente i risultati tramite reti neurali deep learning. Le posso dire che il modello è calibrato e dà una buona rappresentazione della realtà», così Breda.
Da qualche settimana, nei cruscotti viene offerta anche la proiezione dell’indice R0, che è uno dei 21 parametri utilizzati da MinSalute e Iss nel monitoraggio dell’andamento epidemiologico. Indica quante persone un infetto può contagiare finché non guarisce. In questo caso il calcolo è più complesso. Va considerato il tasso di incontro, quindi tenuto conto delle misure contenitive e dei dispositivi di protezione.
Le strategie di implementazione delle varie previsioni (vale per i casi non identificati, per l’R0 e le altre proiezioni) sono una prerogativa di Engineering, ma potrebbero essere pubblicate più in là.
«Abbiamo testato che i dati che riusciamo a calcolare sono piuttosto allineati con quelli ufficiali», ancora Breda.
Engineering tira fuori queste stime da open data, quelli pubblici della Protezione civile, non quelli sanitari in possesso delle Asl per esempio. Avendo invece a disposizione anche uno spaccato sui soggetti, l’età, la professione, si potrebbe ipotizzare possibili cluster. O decidere quali settori far tornare prima al lavoro, quando si allentano le misure di contenimento. Non tutti gli individui contribuiscono allo stesso modo all’R0: chi lavora in fabbrica avrà più possibilità di contagiare rispetto a chi lo fa in agricoltura ad esempio. Avere a disposizione dati stratificati, consentirebbe – a chi come Engineering è partner tecnologico della pubblica amministrazione e delle autorità sanitarie – di offrire un servizio più completo, che renderebbe più agevole orientare le scelte (anche per il monitoraggio dei pazienti a domicilio). In Veneto, dove questo spaccato c’è, Engineering cura la bio-sorveglianza che ha portato la regione di Zaia in vetta nella gestione dell’emergenza Covid. Anche la Lombardia ora ha chiesto servizi alla multinazionale.
«Quando è scoppiata la pandemia, abbiamo immediatamente deciso di investire in questo sviluppo. Ci sentivamo in dovere di farlo», racconta Breda. «Usare i dati per capire è un richiamo naturale per chi lavora negli Analytics», aggiunge Cazzin. «Essere pronti rispetto a questa situazione è stato quasi naturale – chiosa Pierpaolo Truglia, responsabile commerciale la sanità in Puglia, Basilicata e nella nostra regione – In Molise le progettualità innovative possono essere portate avanti bene. Lo dimostra il fascicolo sanitario elettronico che è uno dei più avanzati a livello italiano. Su questo tema specifico, abbiamo posto alla sensibilità degli operatori, azienda e Regione, le potenzialità di quel che possiamo mettere in campo». Il modello di riferimento c’è, conclude, è quello che è stato implementato in Veneto.

rita iacobucci

Commenta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.