Indice

Indicare e scegliere le variabili

Uno dei vantaggi dei pacchetti del tidyverse per la gestione e la trasformazione dei dati è la semplicità con la quale è possibile indicare le variabili, per nome, anziché con gli indici (ad. es. data[,i]) o la forma data$var.

Vedi anche:

La grammatica del tidyverse

All'interno delle funzioni dei pacchetti del tidyverse, le variabili possono infatti essere indicate con gli indici (vedi Indicizzazione) o anche semplicemente con il loro nome.

Tutte le funzioni prevedono che il dataset (esclusivamente dataframe e tibble) venga indicato come primo argomento. Ad esempio:

select(ChickWeight, Chick, weight)

Il nome delle variabili può essere indicato senza virgolette, se non contiene spazi:

select(dataset, variabile1, "variabile 2")

Per usare gli indici:

ChickWeight %>% select(c(3,1))

o anche

ChickWeight %>% select(3,1)

Helpers

Esistono delle funzioni, nel pacchetto tidyselect, che aiutano nel selezionare più variabili, in base a criteri o pattern.

In base ad un pattern:

Con un vettore carattere:

Con una funzione