La frequenza cumulata di una modalità è data dalla somma della sua frequenza e di quelle che la precedono, ed indica quindi il numero di casi al di sopra o al di sotto di un certo valore.
Per calcolare le frequenze cumulate usiamo la funzione cumsum()
: cumsum(table(X))
Ad esempio:
# dati data(ChickWeight) # frequenze cumulate cumsum(table(ChickWeight$Diet)) # oppure table1 <- table(ChickWeight$Diet) cumsum(table1)
## 1 2 3 4 ## 220 340 460 578
La funzione (si tratta di una somma) può essere applicata solo a vettori numerici: quindi, in caso di variabili categoriali, non direttamente alla variabile, ma alla tabella di frequenza (verranno sommate le frequenze).
Si calcolano come le frequenze cumulate, ma con la funzione rev()
applicata alla tabella:
cumsum(rev(table1)) ## 4 3 2 1 ## 118 238 358 578
Alternativamente, si deve specificare l'ordine (inverso) degli elementi che compongono la tavola di frequenza.
cumsum(table1[4:1]) ## 4 3 2 1 ## 118 238 358 578
E' possibile scaricare ed eseguire lo script dell'esempio:
# dati data(ChickWeight) cumsum(table(ChickWeight$Diet)) table1 <- table(ChickWeight$Diet) cumsum(table1) cumsum(rev(table1)) cumsum(table1[4:1])