Indice
Grafici quantili-quantili (Q-Q plot)
I grafici quantili-quantili mettono a confronto i quantili di due distribuzioni.
Per il controllo di normalità della distribuzione
I quantili di una variabile possono essere messi a confronto con quelli della distribuzione normale di una variabile teorica con la stessa media e la stessa deviazione standard.
# dati data(SLID, package = "carData")
qqnorm(SLID$wages)
Sull'asse delle X sono rappresentati i quartili della distribuzione normale (i valori attesi in caso di normalità), in termini di deviazioni standard, su quello delle Y i valori campionari (quindi quelli della variabile), in termini di valori grezzi.
Per disegnare la linea dei valori attesi, e confrontare le due distribuzioni, usiamo la funzione qqline()
:
qqnorm(SLID$wages) grid() # griglia qqline(SLID$wages, lwd = 2, # spessore col = "red" # colore )
La funzione qqline()
disegna la retta che passa per per il primo e il terzo quantile della distribuzione osservata. Rappresenta cioè la forma che essa avrebbe se fosse normale, basandosi sul primo e terzo quartile dei dati.
La linea rossa rappresenta quindi i valori attesi. Se la variabile fosse normale, le due linee coinciderebbero; pertanto:
- Se la distribuzione della variabile ha la forma di una S, la distribuzione è asimmetrica;
- Se invece è al di sotto o al di sopra della linea, la distribuzione è platicurtica (la densità è maggiore sulle code), o leptocurtica (la densità è maggiore del previsto intorno ai valori centrali).
In questo caso, rileviamo sia la coda verso i valori alti, che l'addensamento dei punti sui valori bassi.
Altro
Script di esempio
E' possibile scaricare ed eseguire lo script dell'esempio: