Menu
big data

BIG DATA E INTELLIGENZA ARTIFICIALE PER COMBATTERE LA PANDEMIA DI COVID-19

I BIG DATA E IL COVID-19

Durante il periodo di lockdown causato dal virus del COVID-19, gli scienziati di tutto il mondo hanno utilizzato dati provenienti da internet, dispositivi mobili e indossabili e gli stessi sono stati successivamente elaborati da algoritmi di Intelligenza Artificiale (IA). Questo ha permesso in anticipo di prevedere l’andamento dei contagi e le modalità di trasmissione e comparsa del virus. Inoltre grazie all’utilizzo di questi “big data” è stato possibile identificare i target per gli studi sui vaccini.

COSA SONO I BIG DATA E A COSA SERVONO?

Big data” è un termine introdotto negli anni ‘90 per rappresentare una raccolta di dati informativi così estesa in termini di volume (terabyte), velocità e varietà da richiedere tecnologie e metodi analitici specifici.

Un esempio di questi dati possono essere i tweet o tutti quei dati che derivano dai social network, dai portali di e-commerce oppure dati che sono prodotti dai sensori per la guida autonoma etc. (Wikipedia). Si stima che nel 2020 si raggiungerà un numero pari a 200 miliardi di dispositivi connessi alla rete e in grado di fornire queste informazioni (Sanità 24, Il sole 24 ore, 2019). Per la prevenzione ed il monitoraggio delle patologie e come nel caso della pandemia di COVID-19, numerosi studi scientifici (SAGE Open Medicine, 2020) utilizzano i big data per creare modelli di cura personalizzati. Grazie a strumenti innovativi (come i sequenziatori di DNA di nuova generazione) si può sequenziare un intero genoma umano in poco tempo con costi contenuti.

Ciò ci permette di conoscere il patrimonio genetico del paziente e individuare la cura più idonea e più efficace a seconda dell’individuo che manifesta una determinata patologia.

PREVEDERE IL FUTURO DEL COVID-19

Questo anno è stato segnato da un evento particolarmente importante, ossia la pandemia di COVID-19, che ci ha costretti ad un distanziamento forzato per evitare l’aumento dei contagi. Fortunatamente le tecnologie a nostra disposizione sono molte di più rispetto a quelle utilizzate in passato, ad esempio durante la pandemia di Spagnola. Gli scienziati e i ricercatori nelle università attraverso le ricerche finanziate da proprietari di grosse aziende, come Google, Alibaba, Microsoft e Amazon, hanno investito tempo e denaro nella digitalizzazione. I risultati hanno permesso di fare qualcosa che probabilmente fino a qualche anno fa era impensabile: osservando e analizzando i dati ottenuti dagli scienziati e dai cittadini in rete è stato possibile monitorare la pandemia di COVID-19 ed identificare target per lo sviluppo di vaccini e farmaci sempre più efficaci.

MONITORAGGIO IN ITALIA

GOOGLE TREND APPLICATO AL COVID-19

Uno studio italiano condotto a Bologna presso l’Istituito Ortopedico Rizzoli (Internal and Emergency Medicine, 2020) ha dimostrato come l’utilizzo dell’epidemiologia digitale può fornire numerose informazioni sulla diffusione dell’infezione virale di COVID-19 in Italia. Per questo studio è stato utilizzato Google Trend, strumento pubblico ad accesso libero (ossia utilizzabile da qualsiasi persona nel mondo) che viene utilizzato per monitorare la frequenza di una determinata frase o parola sui motori di ricerca potendo selezionare aree geografiche di interesse. Importante notare come questo strumento sviluppato appunto per capire le tendenze delle ricerche nel web sia stato utilizzato come strumento utile anche nel campo della medicina.

I trend sono rappresentati mediante un grafico che riporta l’andamento nel tempo di una determinata frase o parola, ossia ci mostra quante volte questa è stata ricercata o visualizzata. Il gruppo di scienziati di Bologna ha inserito come parole da ricercare “TOSSE” e “FEBBRE”, sintomi che sappiamo essere i primi probabili segni di infezione da COVID-19. Il periodo analizzato va dal 24 Febbraio 2020 al 6 Aprile 2020.  Interessanti risultati sono emersi da questa ricerca: gli studiosi hanno inserito in un grafico il numero dei casi giornalieri dei ricoveri in terapia intensiva comparati con i risultati ottenuti sulle ricerche di “TOSSE” e “FEBBRE” e si è osservato che il grafico mostra una correlazione temporale tra queste due variabili, in particolare si è visto un periodo di ritardo tra le ricerche sul web delle parole “TOSSE” e “FEBBRE” e ricoveri/decessi in ospedale di circa 1 o 2 settimane.

In parole semplici, una settimana prima in internet un numero di persone ha mostrato avere i sintomi del COVID-19 e dopo 1/2 settimane si è osservato lo stesso trend nei ricoveri o decessi in ospedale. Come viene perciò sostenuto in questo articolo, l’interpretazione dei dati di Google Trends avrebbero potuto esserci utile per allertare il sistema sanitario italiano su cosa stava per succedere ben una settimana in anticipo.

UN SUPERCALCOLATORE E UNA LIBRERIA CHIMICA PER PREDIRE FARMACI CONTRO IL SARS-CoV-2

Sempre a Bologna troviamo il supercalcolatore Marconi, il quale ha permesso di vincere a Dompè farmaceutici 3 milioni di euro dal programma quadro Horizon 2020 con il progetto europeo chiamato Exscalate4CoV (E4C). Questo progetto vede la sua collaborazione con 18 istituzioni e centri di ricerca e 7 paesi europei, nei quali sono presenti il Consorzio Interuniversitario CINECA di Bologna e l’Università di Milano, Napoli e Cagliari, oltre che al centro di eccellenza Istituto Spallanzani di Roma. La piattaforma di supercalcolo utilizzata (tra le più performanti al mondo) permetterà di valutare 3 milioni di molecole al secondo da una “biblioteca chimica” di 500 miliardi di molecole con l’obbiettivo di selezionare le molecole più promettenti per contrastare l’attuale epidemia di COVID-19 e strutturare un modello operativo di intervento efficace a livello europeo per eventi analoghi. Inoltre tutti i dati ottenuti saranno messi a disposizione della comunità scientifica (DOMPÈ, 2020).

ANTICIPARE CASI DI COVID-19 CON LA TOMOGRAFIA COMPUTERIZZATA

Un altro progetto italiano si svolge nel centro Città della Salute a Torino, che vede la collaborazione tra il Dipartimento di Radiologia Diagnostica ed Interventistica, guidato dal professor Paolo Fonio, ed il Dipartimento di Informatica dell’Università di Torino, guidato dal professor Guido Boella. Il progetto si è potuto avvalere della collaborazione di Infervision, un’impresa high-tech leader globale nell’intelligenza artificiale medica, la Commissione Europea e la Compagnia San Paolo (Torinotoday, 2020). Come riportato dal sito di Infervision, l’algoritmo InferRead™ AI permette di rilevare casi di potenziali COVID-19 dalle immagini di Tomografia Computerizzata (TC) e comunicarlo direttamente al medico, consentendo a quest’ultimo di dirigere rapidamente il paziente verso ulteriori procedure e di ridurre il rischio di ulteriore diffusione del virus. I medici possono anche capire con precisioni le condizioni del paziente e sviluppare un piano di trattamento personalizzato (Newswire, 2020). Si è osservato che i pazienti affetti da COVID-19 presentano spesso caratteristiche uniche e differenti nei risultati della TAC rispetto alla polmonite normale. Durante le sue fasi iniziali, le scansioni mostrano generalmente infiltrazioni irregolari e cambiamenti nella periferia polmonare. Solo medici esperti sono in grado di notare la differenza tra queste patologie.

 E NEL RESTO DEL MONDO? – IL DATABASE NEXTSTRAIN

Un gruppo di scienziati di varie nazionalità ha creato un database consultabile nel web, chiamato Nextstrain. Questo database, oltre ad essere gratuito, è aperto a tutti e vengono raccolti tutti i dati di sequenziamento sul COVID-19 e non solo (sono presenti altri patogeni come Zika, Ebola, Influenza etc.). Il sequenziamento è quel processo che permette di individuare l’ordine delle basi dell’acido nucleico, e nel caso del COVID-19, ottenere tutte le informazioni contenute nell’RNA di questo virus sconosciuto, come funziona, come si alimenta e come si può eliminare. Questa repository Web ha lo scopo di fornire un’istantanea in tempo reale delle popolazioni patogene in evoluzione e di fornire visualizzazioni interattive dei dati a virologi, epidemiologi, cittadini e scienziati (Nextstrain.org, 2020).

La vera innovazione è proprio quella di collezionare i dati provenienti dalle nuove tecnologie di sequenziamento del DNA in un unico database, ma soprattutto di poter visualizzare i dati in tempo reale e in modo gratuito, rendendo così i dati accessibili a tutti i laboratori del mondo, anche di paesi più poveri che non possono permettersi di comprare strumentazioni costose per ottenere tali dati. L’accesso alla visualizzazione dei dati a quanti più scienziati possibile rende più veloce la produzione di idee, studi ed analisi per combattere il COVID-19.

In uno studio della Standford University, pubblicato sulla prestigiosa rivista Nature Biomedical Engineering, sono state analizzate le informazioni raccolte dagli smartwatch di 3500 persone ed è stato scoperto che nel 63% dei casi è stato possibile scoprire la positività del COVID-19 prima della comparsa dei sintomi; infatti ben l’81% degli individui che sono risultati positivi al virus manifestava un’alterazione della frequenza cardiaca, della durata del sonno e del numero di passi giornalieri. Tale scoperta può aiutare a monitorare la trasmissione del virus e procedere con l’autoisolamento, in casi sospetti COVID-19, in attesa dell’esito del tampone, il cui risultato richiede un tempo più lungo che potrebbe rallentare un corretto monitoraggio (AGI, 2020).

CONCLUSIONI

La tecnologia diventerà sempre più importante ed indispensabile e ci permetterà di risolvere problemi in maniera sempre più semplice e veloce. I vantaggi dell’utilizzo di big data e dell’IA è sempre più evidente alla comunità scientifica, anche se rimangono ancora questioni da risolvere, come, per esempio, quella relativa alla proprietà dei dati che devono essere trattati garantendo privacy e sicurezza. Questo problema, squisitamente legislativo, sta rallentando notevolmente i progressi che si potrebbero raggiungere in tempi brevi grazie all’utilizzo di tali tecnologie.

Importante è lo sforzo che fino ad ora è stato fatto in Europa e USA con investimenti mirati all’ottimizzazione dei software necessari per l’elaborazione dei big data. In Italia alcuni sistemi regionali hanno già avviato un processo di digitalizzazione e potrebbero beneficiare delle nuove tecnologie senza dover incorrere nei costi di preparazione delle infrastrutture. È da sottolineare l’importanza dell’utilizzo dei dispositivi elettronici ed internet che fanno sempre più parte della nostra vita e di come possono essere sfruttati per migliorare la qualità della vita. Sarà utile trasmettere soprattutto alle future generazioni quanto è necessario utilizzare queste tecnologie per riuscire a usufruire dei benefici legati ad essi.

BIBLIOGRAFIA

 

 

A cura di Valentina Aleotti.

Revisionato da Luca Malinverno.

 

 

Licenza Creative Commons
Quest’opera di Biochronicles A.P.S. è distribuita con Licenza Creative Commons Attribuzione – Condividi allo stesso modo 4.0 Internazionale.


About the Author : Valentina Aleotti

Dottoressa in Biologia, Aspirante ricercatrice e divulgatrice scientifica. Fan di Piero Angela e dei film di Tarantino. Iperattiva, curiosa e amante dei viaggi. Linkedin

0 Comment

Leave a Comment

Your email address will not be published.

Related post

  TOP