r:analisi-testuale:quanteda
Indice
Quanteda
Pacchetti per la gestione e l'analisi dei dati testuali.
- Quanteda, pacchetto base;
- textstats, statistiche;
- textplots, grafici;
- textmodels, modelli e classificazioni.
Vantaggi:
- offre strumenti per il text mining, ma anche per l'analisi testuale e linguistica;
- integra spaCy, per la lemmatizzazione e il tagging grammaticale (POS recognition);
- compatibile e progressivamente integrato con tidytext, e quindi con i pacchetti Tidymodels.
Svantaggi:
- richiede una maggiore conoscenza degli strumenti della statistica testuale e del NLP.
Vedi:
- Strumenti per l’analisi testuale e il text mining con R (A. Vardanega, in progress, testo liberamente accessibile da web)
workflow e funzioni
All'interno del testo citato sopra, ho - per il momento - dedicato spazio ai seguenti argomenti:
- workflow: sintesi dei principali step operativi.
- importazione dei testi; vedi anche, qui, Importazione dei testi
- corpus: costruzione, funzioni
- segmentazione del corpus
- summary: tabelle e grafici riassuntivi
- kwic, keywords in context
- textplot_xray, grafici delle keywords in context
r/analisi-testuale/quanteda.txt · Ultima modifica: 13/08/2025 10:54 da Agnese Vardanega