È in funzione da oltre un anno, ma il suo funzionamento è stato spiegato in un
articolo di Nature solo di recente. parliamo di
Eva, il sistema di machine learning che la Grecia ha adottato per ottimizzare i controlli anti-Covid sui viaggiatori in ingresso. Un sistema pensato per non sprecare in
controlli indiscriminati le limitate risorse allocabili ai test sul campo, focalizzandole dove gli algoritmi di machine learning giudicavano più opportuno. In base alle informazioni demografiche comunicate dai viaggiatori che stavano per entrare in Grecia ed ai risultati dei test precedenti.
I creatori di EVA spiegano che l'approccio più frequente al contenimento della pandemia - bloccare gli ingressi di chi proviene da nazioni con tassi di positività al virus e mortalità elevati -
non è efficiente, perché le
informazioni si cui si basano le decisioni sono poco affidabili. Da qui l'idea di sviluppare un sistema basato su machine learning, che cercasse di identificare i malati asintomatici in ingresso e, nel contempo,
dare una valutazione precisa in tempo reale del ruolo degli ingressi alla frontiera nella diffusione della pandemia Covid-19.
Eva è stata implementata in tutti - una quarantina - i punti di possibile ingresso in Grecia: porti, aeroporti, posti di confine. Per il suo funzionamento, la prima base dati di partenza su cui l'AI poteva lavorare erano
le informazioni che il singolo viaggiatore inseriva nel cosiddetto Passenger Locator Form (PLF), che andava consegnato almeno 24 ore prima dell'ingresso effettivo in Grecia. I
dati demografici inclusi nel PLF (ad esempio nazione e regione di provenienza, età, genere),
combinati con i risultati dei test condotti in precedenza su altri viaggiatori, permettevano di definire
classi di viaggiatori accomunate da una certa probabilità di essere positivi asintomatici. I criteri per l'appartenenza a queste classi venivano aggiornati settimanalmente.
In base alla classificazione dei viaggiatori in ingresso nei giorni successivi, gli algoritmi di Eva stabilivano in maniera automatica
dove allocare le risorse per eseguire test mirati. L'obiettivo era evitare di sprecare inutilmente risorse limitate. La Grecia al lancio di Eva disponeva di 400 operatori sanitari da distribuire nei 40 punti di ingresso, per test che andavano inviati a 32 laboratori distribuiti su tutta la nazione. Eva ha fatto in modo che queste risorse andassero
dove c'era la maggiore probabilità di rilevare contagiati inconsapevoli.
Non solo questo, però. Un sistema di machine learning che si focalizzasse solo sulle categorie di viaggiatori
chiaramente più a rischio sarebbe diventato presto poco utile. Eva allocava alcune risorse di test anche in modo da
raccogliere più informazioni sulle classi demografiche di viaggiatori per le quali aveva meno dati. Allo scopo di poter effettuare previsioni accurate anche per le classi con una prevalenza moderata o bassa di positività. E
conoscere lo stato delle classi di cui si sapeva poco o nulla. Le indicazioni di Eva sono state usate anche come base per la scelta - non automatica - di nazioni particolarmente "problematiche" da cui limitare gli ingressi
a priori. Una scelta non totalmente lasciata al machine learning perché ha, ovviamente, anche implicazioni politiche ed economiche.
I numeri di Eva
Nel picco della stagione turistica - agosto e settembre 2020 - gli algoritmi di Eva hanno elaborato
poco meno di 42 mila PLF al giorno, portando a testare quotidianamente il 16,7% delle famiglie in ingresso. Si stima che Eva sia stata
significativamente più efficace dell'eseguire test a campione casuali. Secondo i ricercatori greci, test casuali avrebbero identificato
solo la metà (il 54%, per la precisione) dei positivi asintomatici rilevati grazie alle indicazioni del machine learning. Questo almeno nelle condizioni di effettivo funzionamento, ossia con molti ingressi e con scarse risorse di test. Con pochi ingressi o con più risorse i test guidati hanno meno vantaggi, perché sale la probabilità di rilevare anche solo casualmente le positività.
Le stime indicano che
Eva è più efficace anche delle politiche di testing mirato guidate solo dai dati demografici dei PLF e non anche dal machine learning. Secondo il report di Nature, selezionare i viaggiatori da testare solo in base al numero di casi oppure ai tassi di mortalità o positività delle regioni di provenienza portava a meno identificazioni di positivi asintomatici rispetto ad Eva. Più in dettaglio, ragionare per numero di casi portava a una efficacia del 69% rispetto al machine learning, percentuale che diventava del 73% circa guardando solo ai tassi di mortalità e del 80% circa per il tasso di positività.
Data la scarsità delle risorse per i test sul campo,
anche margini contenuti a favore di Eva sono stati fondamentali. Inoltre, si stima che le indicazioni date da Eva per bloccare gli ingressi da nazioni considerate in quel momento più a rischio dal machine learning abbiano
evitato l'ingresso di un 6,7% in più di viaggiatori infetti, nella stagione di picco.