Questa è una vecchia versione del documento!
Variabili nominali
Abbiamo una variabile nominale quando il Carattere (statistico) che stiamo studiando assume stati discreti non ordinabili: lo stato civile assume ad esempio stati discreti (non esiste un possibile punto intermedio fra l’essere celibi e l’essere coniugati) e non ordinabili (non è possibile stabilire una relazione di maggiore o minore fra le diverse modalità).
Le categorie non sono ordinabili, nel senso caratterizzate da una elevata autonomia semantica1): il significato della modalità “religione cattolica”, ad esempio, può essere compreso indipendentemente dalle altre modalità della variabile (ebraica, buddista, ecc.). Cosa che non avviene invece per le categorie ordinate, dove il significato di “alto” è connesso a quello di “medio” e di “basso”.
Ciò ha importanti conseguenze sulle procedure dell'analisi delle variabili categoriali in generale, e di quelle nominali in particolare.
L’operazione di costruzione di una variabile di questo tipo è detta classificazione, l’assegnazione dei casi a classi o categorie (come possiamo chiamare le modalità di una variabile nominale), che devono essere esaustive – consentire la collocazione di ogni caso studiato – e mutuamente esclusive – tali che ogni caso possa essere attribuito ad una ed una sola categoria. Questi due criteri si applicano a tutti i tipi di variabili.
Operazioni consentite
Sulla base di una variabile nominale, possiamo stabilire se due casi sono uguali o diversi rispetto al carattere in oggetto: non possiamo operare nessun tipo di operazione aritmetica sulle modalità, anche se possiamo lavorare sul numero di casi collocati entro le categorie.
Non è dunque possibile utilizzare misure quali la mediana, le medie e tutte quelle che ne derivano (deviazione standard, correlazione, ecc.).
Un discorso a parte meritano sotto questo profilo le Variabili dicotomiche, variabili nominali, con le quali è possibile effettuare alcune operazioni fra quelle riservate alle sole Variabili cardinali (o quantitative).
Codifica
Le modalità delle variabili nominali andrebbero – a rigore – codificate utilizzando stringhe alfanumeriche, ad esempio:
Modalità del carattere | Codice della variabile nominale |
---|---|
donna | “donna” (o “D”) |
uomo | “uomo” (o “U”) |
Per svariate ragioni (ad esempio la facilità dell'inserimento dei dati in matrice) può però essere comodo usare codici numerici, che naturalmente andranno trattati comunque come stringhe:
Modalità del carattere | Codice della variabile nominale |
---|---|
donna | “1” |
uomo | “2” |
Poiché le categorie non sono ordinabili, non esiste una regola per la codifica delle modalità: possiamo attribuire il codice “1” tanto alla modalità “donna” quanto alla modalità “uomo” (in questo caso, li si è ordinati alfabeticamente).
Vedi anche: