Ricerca Sociale con R

Una wiki per l'analisi dei dati con R

Strumenti Utente

Strumenti Sito


Il Laboratorio di Analisi dei Dati con R, dell'Università di Teramo su piattaforma Meet, inizia il 9 aprile 2021 - Iscrizione - email

Barra laterale

Segui il canale Telegram

Max 3 mess. al giorno (cos'è?)

Contenuti

Ultimi post del blog

Video e tutorial

Pagine aggiornate


Formazione

Mini webinar

Incontri individuali online


Ricerca sociale con R (il libro)


Contatti



Download R
r:gestione_dei_dati:variabili_e_vettori

Variabili e vettori in R

In R, la Matrice dei dati corrisponde al Dataframe, mentre le Variabili della matrice si chiamano (in quanto sono) Vettori.

Tipi di variabili e vettori

I vettori carattere che corrispondono alle variabili categoriali (nominali e ordinali si chiamamo fattori, mentre alle Variabili cardinali (o quantitative) corrispondono i vettori numerici.

Attenzione:

Quando si costruiscono o si importano variabili le cui modalità sono costituite da testo (caratteri), queste, dalla versione 4, non vengono più automaticamente riconosciute da R come fattori.

Le variabili le cui modalità sono costituite da numeri vengono invece automaticamente riconosciute come vettori numerici, e trattate dunque come variabili cardinali. Per utilizzarle come variabili categoriali, esse dovranno essere trasformate in fattori (vedi Fattori).

Etichette di variabili e modalità

Etichette delle variabili

Le colonne di un dataframe hanno un nome, che può essere richiamato con il comando colnames (o anche con names):

colnames(ChickWeight)
[1] "weight" "Time"   "Chick"  "Diet" 

Possiamo rinominare le colonne di un dataset in questo modo:

# lavoriamo su un copia di ChickWeight
mydata<-ChickWeight
 
# traduciamo le etichette del dataframe
colnames(mydata)<- c("Peso", "Eta", "Pollo", "Dieta")

Vedi: Rinominare le variabili

Etichette delle modalità

Le variabili categoriali devono avere etichette anche di modalità. In R, le etichette corrispondono ai livelli dei fattori.

Attribuire e modificare le etichette

Cambiare l'ordine delle etichette

A volte può essere necessario modificare l'ordine delle modalità, senza trasformare le variabili nominali in fattori. Esempio

require(MASS)
table(survey$Clap)

   Left Neither   Right 
     39      50     147 

Riordiniamo i livelli in: Left, Right, Neither:

survey$Clap <- factor(mysurvey$Clap,levels(mysurvey$Clap)
                      [c(1,3,2)])

I nomi delle variabili

I nomi delle variabili possono contenere una qualsiasi sequenza di lettere e numeri ma:

  1. non possono cominciare con un numero.
  2. non devono contenere spazi: in fase di conversione da altri formati di files, gli spazi verranno convertiti in punti (.). Ad esempio: Anno di nascita diventerà Anno.di.nascita.
  3. non devono contenere i trattini, come in Anno-di-nascita.

Di solito, si evitano anche gli underscore, come in Anno_di_nascita, anche se non sono vietati.

In sintesi: per le espressioni lunghe, adottare il sistema detto CamelCase (AnnoDiNascita) o i punti (Anno.di.nascita).

Alcune parole, poi, sono riservate, ovvero non possono essere usate. Si tratta delle seguenti: FALSE, TRUE, Inf, NA, NaN, NULL, F, T, D, break, else, for, function, if, in, next, repeat, while.

Per approfondire

r/gestione_dei_dati/variabili_e_vettori.txt · Ultima modifica: 21/09/2021 14:22 da admin