L’articolo — scritto con Claudia Vardanega — analizza il discorso sul coronavirus nei titoli dei quotidiani italiani, con un focus sui temi e le parole chiave che hanno caratterizzato la comunicazione giornalistica durante la pandemia. L’analisi è stata condotta su un campione di articoli pubblicati tra febbraio e maggio 2020, utilizzando tecniche di analisi del contenuto e di text mining.

Pubblicato su Progressus (II, 2020).

Potete leggere qui l'articolo in PDF (si aprirà una nuova scheda del browser).

L’analisi

Abbiamo analizzato i titoli delle notizie pubblicate tra il 22 febbraio e il 15 maggio 2020, che contenevano la parola “coronavirus” (in base ai dati delle ricerche su Google Trends).

La scelta di concentrarsi sui titoli degli articoli è motivata da due fattori principali. In primo luogo, volevamo analizzare ció che cattura l’attenzione immediata dei lettori, che spesso si limita alla lettura dei titoli, soprattutto sui social media. In secondo luogo, ci ha permesso di includere nel campione sia gli articoli gratuiti che quelli a pagamento.

I titoli sono stati rilevati settimanalmente su Google Search, indicando le date e selezionando 50 risultati al giorno.

La scelta di rilevare i primi 50 risultati ha ridotto il bias di geolocalizzazione e ci ha permesso di raccogliere dati da 248 testate online nazionali, locali e televisive, garantendo anche una buona varietà di fonti locali.

L’analisi dei titoli è stata svolta con R, ed in particolare con Quanteda , ed altri pacchetti per l’analisi testuale e l’analisi dei temi mediante Latent Dirichlet Allocation.

Numeri, scienza ed esperti

Il grafo dell’immagine è costituito da due tipi di nodi (temi e termini) e gli archi collegano esclusivamente nodi appartenenti a gruppi diversi: i termini ai temi. Il numero di connessioni tra i temi può quindi essere considerato come un indicatore di vicinanza semantica.

Nel grafo, si osservano due cluster di temi principali:

  • Il primo macro-cluster, che possiamo chiamare “i numeri della pandemia”, è formato dai temi “numeri” e “bollettini”, associati a “cronaca” ed “esteri”. Rappresenta i dati presentati in un contesto giornalistico e narrati in modo cronachistico.

  • Il secondo macro-cluster, “la guerra al virus”, è costituito dai temi “Misure”, “scienza” ed “esperti”.

La distanza tra i due cluster, ad ogni modo, evidenzia una separazione tra la presentazione dei dati e la loro interpretazione scientifica.