🍂 Ripropongo questo post così come lo avevo scritto, perché è un caso di dati inizialmente diffusi, poi ritirati improvvisamente. Tanto improvvisamente, che non sono riuscita a recuperare gli ultimi grafici e le ultime tabelle, ma solo il primo grafico del Centro-Sud, pubblicato su Facebook. Lavorare con i dati aperti significa confrontarsi con l’affidabilità e le politiche dei dati delle fonti


Da quando i casi di Covid19 hanno iniziato ad aumentare, in alcune regioni in modo esponenziale, le attività di screening e tracciamento faticano a tenere il passo. Se si vogliono tenere aperte scuole e attività economiche, si tratta di un punto fondamentale. Abbiamo al riguardo dati affidabili e ragionevolmente utilizzabili per capire come va? Sì e no. Vediamo perché.

Nel repository della Protezione Civile , sono da tempo disponibili i dati dei positivi testati per “sospetto diagnostico” o a seguito di “attività di screening”.

Nella definizione del Ministero, i “casi identificati da attività di screening” emergono da indagini e test, pianificati a livello nazionale o regionale, che diagnosticano casi positivi al tampone. Questo numero dovrebbe indicare dunque l’esistenza di una vera e propria ricerca attiva dei positivi, incluso il contact tracing. I casi da sospetto diagnostico sono invece quelli individuati per l’insorgenza di sintomi o comunque emersi nel corso dell’attività clinica.

Tali definizioni non sono però chiarissime, e non si può escludere la possibilità che alcune regioni o aziende sanitarie locali includano i casi da contact tracing nella seconda categoria (si veda la discussione nel repository GitHub della Protezione Civile).

Non di rado, inoltre, si segnalano, sempre sul repository della Protezione Civile (Avvisi ) correzione e ricalcoli riguardanti questi dati.

Il tracciamento dei contatti è attività clinica o di screening? Io non so rispondere, ma ho l’impressione che le regioni interpretino queste categorie in maniera discordante. Vale comunque la pena dare un’occhiata ai grafici per regione.

Grafico dei casi da screening e da sospetto diagnostico per le regioni del Nord

Regioni del Nord. Il grafico è stato aggiornato quotidianamente fino al 4 dicembre

Grafico dei casi da screening e da sospetto diagnostico per le regioni del Sud e del Centro

Regioni del Centro e del Mezzogiorno. Il grafico è stato aggiornato quotidianamente fino al 4 dicembre
(questa immagine è stata recuperata da Facebook)

Trattandosi di quote che ogni giorno assommano a 1 (100%) verrebbe “naturale” rappresentare questi dati con degli istogrammi. Ma le linee consentono di visualizzare meglio come evolve la situazione nel corso del tempo.

Come leggere questi grafici:

Premesso che questi dati vanno sempre letti in rapporto al numero di tamponi e al numero di persone testate, oltre che alla percentuali di positivi su testati:

  • Se la linea rossa sta sopra (verso l'1, il 100%), vuol dire che più del 50% dei nuovi positivi emerge da screening. E’ il caso di: Piemonte e Veneto al Nord; Umbria e Lazio al Centro; Puglia e Sardegna al Sud.
  • Se al contrario sta sotto, oltre il 50% dei nuovi casi viene individuato a seguito di attività clinica (“sospetto diagnostico”).
  • Se le due linee sono vicine fra di loro, al centro (0,5), vuol dire che i casi si dividono a metà.

Per quanto riguarda l’andamento della linea si possono osservare oscillazioni casuali, giornaliere, e oscillazioni più ampie magari legate ad eventi particolari (un focolaio). Ma:

  • Linee molto irregolari possono dipendere da un esiguo numero di casi giornalieri, e dunque da oscillazioni casuali ma molto evidenti, come anche da qualche irregolarità nella raccolta e nell’inserimento di dati (in alcuni casi, osserviamo dei “buchi”).
  • Linee completamente piatte, con tutti casi da screening, o da sospetto diagnostico (0,1) sono “strane” (Bolzano, Marche e Calabria): potrebbe essere che questa informazione non venga inserita correttamente?

Io sono sempre stata dell’idea che i sistemi sanitari debbano prima curare i pazienti, e poi occuparsi dei dati da inviare quotidianamente al Dipartimento della Protezione Civile. Non mi scandalizzo per errori, correzioni, e riconteggi. Non ci vedo intenzioni maligne o “complottare”. Forse però in questa nuova stagione della pandemia, è arrivato il momento di chiarire e uniformare tali definizioni, per avere dati ragionevolmente affidabili per “tracciare il tracciamento”.

Dal 4 dicembre questi dati non vengono più “erogati”. Le tabelle non saranno quindi più aggiornate.