Ricerca Sociale con R

Una wiki per l'analisi dei dati con R

Strumenti Utente

Strumenti Sito


Il Laboratorio di Analisi dei Dati con R, dell'Università di Teramo su piattaforma Meet, inizia il 9 aprile 2021 - Iscrizione - email
r:analisi_bivariata:covarianza

Covarianza

La covarianza misura quanto, al deviare dei valori di una variabile dalla sua media, deviino anche quelli di una seconda variabile dalla sua.

$$cov_{XY}=\frac{\sum\left(x_i-\bar{X}\right)\left(y_i-\bar{Y}\right)}{n\ -\ 1}$$

Mentre al numeratore della varianza troviamo il quadrato degli scarti dalla media $(x_i – \bar{X})^2$, in questo caso al numeratore troviamo il prodotto degli scarti delle due variabili

La funzione per il calcolo della covarianza in R è cov():

# dati
data("cars")
 
# covarianza
cov(cars$speed, cars$dist)
##  [1] 109.9469

La covarianza può avere valori positivi o negativi: se le due variabili deviano nella stessa direzione, gli scarti avranno lo stesso segno e il loro prodotto sarà positivo; altrimenti il risultato sarà negativo.

La sua entità dipende però dall’ordine di grandezza e dalle unità di misura delle variabili: nel nostro esempio, miglia orarie per la velocità e piedi per lo spazio di frenata.

Standardizzando la covarianza rispetto alle deviazioni standard delle due variabili, si ottiene il coefficiente di correlazione di Pearson:

$$r_{XY}\ =\ \frac{{\rm cov_{XY}}}{{\rm sd}_X{\rm sd}_Y}$$

r/analisi_bivariata/covarianza.txt · Ultima modifica: 22/09/2018 11:08 da admin