Ricerca Sociale con R

Una wiki per l'analisi dei dati con R

Strumenti Utente

Strumenti Sito


Il Laboratorio di Analisi dei Dati con R, dell'Università di Teramo su piattaforma Meet, inizia il 9 aprile 2021 - Iscrizione - email

Barra laterale

Segui il canale Telegram

Max 3 mess. al giorno (cos'è?)

Contenuti

Ultimi post del blog

Video e tutorial

Pagine aggiornate


Formazione

Mini webinar

Incontri individuali online


Ricerca sociale con R (il libro)


Contatti



Download R
r:gestione_dei_dati:eliminare_i_dati

Eliminare i dati (dataframe)

Per eliminare variabili e casi da un dataframe, utilizziamo l'indicizzazione [r,c]. Per eliminare singoli valori delle celle, dobbiamo sostituirli con NA.

Eliminare variabili (colonne)

Si utilizza la solita notazione (colonna 2 = [,2]), con il segno meno: [,-c] (vedi: Indicizzazione).

# in un nuovo dataframe
newdata <- mydata[,-1]
 
# nello stesso dataframe (non eseguire)
mydata <- mydata[,-1]
 
# oppure
mydata[1] <- NULL

Vedi anche select, rename (dplyr)

Eliminare casi (righe)

Si utilizza la solita notazione (riga 17 = [17,]), con il segno meno: [-r,]

# eliminare una riga
newdata <- mydata[-17,]
 
# nello stesso dataframe (non eseguire)
mydata <- mydata[-17,]
 
# eliminare più righe: si indica un vettore di righe
newdata <- mydata[-c(2, 4, 15),]

Naturalmente, possiamo indicare anche un vettore di colonne.

Vedi anche filter (dplyr)

Eliminare singoli valori (celle)

Si tratta di una operazione di trasformazione del dato in valore nullo NA: non possono esistere celle vuote o vettori-riga / colonna di lunghezza diversa.

mydata[2, 1] <- NA

(vedi anche Ricodificare le variabili)

Script di esempio

Es Eliminare Dati.R
# COSTRUIRE UN DATAFRAME DI ESEMPIO
X <- factor(c(1, 4, 3, 3, 2, 1, 2, 2, 3, 1, 1, 1, 4, 2, 1, 2, 
       3, 4, 2, 2))
levels(X) <- c("N","C","V","S")
 
Y <- factor(c(4, 2, 1, 2, 4, 3, 3, 2, 4, 2, 3, 1, 3, 3, 3, 4, 
       2, 2, 3, 3))
levels(Y) <- c("A","O","S","L")            
Y <-ordered(Y)
 
Z <- c(0, 1, 3, 4, 1, 1, 0, 2, 3, 0, 1, 0, 1, 4, 3, 0, 
       2, 2, 4, 4)
 
mydata <- data.frame(X, Y, Z)
 
 
# ELIMINARE VARIABILI (COLONNE)
 
# in un nuovo dataframe
newdata <- mydata[,-1]
 
# nello stesso dataframe (non eseguire)
mydata <- mydata[,-1]
# oppure
mydata[1] <- NULL
 
 
# ELIMINARE CASI (RIGHE)
 
# eliminare una riga
newdata <- mydata[-17,]
 
# nello stesso dataframe (non eseguire)
mydata <- mydata[-17,]
 
# eliminare più righe: si indica un vettore di righe
newdata <- mydata[-c(2, 4, 15),]
 
 
# ELIMINARE SINGOLI VALORI
mydata[2,1] <- NA
r/gestione_dei_dati/eliminare_i_dati.txt · Ultima modifica: 26/09/2021 07:02 da admin