Ricerca Sociale con R

Una wiki per l'analisi dei dati con R

Strumenti Utente

Strumenti Sito


Il Laboratorio di Analisi dei Dati con R, dell'Università di Teramo su piattaforma Meet, inizia il 9 aprile 2021 - Iscrizione - email

Barra laterale

Segui il canale Telegram

Max 3 mess. al giorno (cos'è?)

Contenuti

Ultimi post del blog

Video e tutorial

Pagine aggiornate


Formazione

Mini webinar

Incontri individuali online


Ricerca sociale con R (il libro)


Contatti



Download R
r:gestione_dei_dati:standardizzazione

Standardizzazione delle variabili

La standardizzazione delle variabili consente il confronto fra dati che appartengono a variabili o a campioni diversi.

La formula della standardizzazione è: $$Z_x = \frac{x_i - X}{\sigma_x}$$ dove:

  • $X$ = media aritmetica (vedi);
  • $\sigma_x$ = deviazione standard, o scarto quadratico medio, o scarto tipo.

In R, è possibile standardizzare una o più variabili di un dataset con la formula:

scale(x, center = TRUE, scale = TRUE)

Ad esempio, il comando

scale(ChickWeight$weight)

restituisce il seguente output (una matrice):

               [,1]
  [1,] -1.123063717
  [2,] -0.996431497
  ...
[577,]  2.000531035
[578,]  2.000531035
attr(,"scaled:center")
[1] 121.8183
attr(,"scaled:scale")
[1] 71.07196  

Gli ultimi due valori (attributi), center e scale sono, rispettivamente, la media aritmetica della variabile originaria, e la sua deviazione standard.

La funzione può essere quindi utilizzata per trasformare le variabili in base a valori diversi.

È anche possibile trasformare un dataset, purché composto interamente da vettori numerici:

Zcars <- scale(cars)

Se un dataset è composto da vettori e fattori, si potranno aggiungere le variabili standardizzate al dataset originario. Es.:

# faccio una copia del dataset originario (per sicurezza)
mydata<-ChickWeight
 
# aggiungo la variabile standardizzata
mydata$z_weight <- scale(mydata$weight)

Script di esempio

Es Standardizz.R
# UNA VARIABILE
scale(ChickWeight$weight)
 
# UN DATASET
Zcars <- scale(cars)
 
# UNA VARIABILE IN UN DATASET
# faccio una copia del dataset originario (per sicurezza)
mydata<-ChickWeight
 
# aggiungo la variabile standardizzata
mydata$z_weight <- scale(mydata$weight)
r/gestione_dei_dati/standardizzazione.txt · Ultima modifica: 26/09/2021 07:46 da admin