I grafici quantili-quantili mettono a confronto i quantili di due distribuzioni.
I quantili di una variabile possono essere messi a confronto con quelli della distribuzione normale di una variabile teorica con la stessa media e la stessa deviazione standard.
# dati data(SLID, package = "carData")
qqnorm(SLID$wages)
Sull'asse delle X sono rappresentati i quartili della distribuzione normale (i valori attesi in caso di normalità), in termini di deviazioni standard, su quello delle Y i valori campionari (quindi quelli della variabile), in termini di valori grezzi.
Per disegnare la linea dei valori attesi, e confrontare le due distribuzioni, usiamo la funzione qqline()
:
qqnorm(SLID$wages) grid() # griglia qqline(SLID$wages, lwd = 2, # spessore col = "red" # colore )
La funzione qqline()
disegna la retta che passa per per il primo e il terzo quantile della distribuzione osservata. Rappresenta cioè la forma che essa avrebbe se fosse normale, basandosi sul primo e terzo quartile dei dati.
La linea rossa rappresenta quindi i valori attesi. Se la variabile fosse normale, le due linee coinciderebbero; pertanto:
In questo caso, rileviamo sia la coda verso i valori alti, che l'addensamento dei punti sui valori bassi.