4.3 Valores faltantes
En R los datos faltantes se expresan como NA
. La función is.na()
regresa un vector lógico sobre los valores que son o no NA
.
is.na(c(4, 2, NA))
## [1] FALSE FALSE TRUE
El default de R es propagar los valores faltantes, esto es, si se desconoce el valor de una de las componentes de un vector, también se desconoce la suma del mismo, en general, cualquier operación.
sum(c(4, 2, NA))
## [1] NA
mean(c(4, 2, NA))
## [1] NA
3 > NA
## [1] NA
(NA == NA)
## [1] NA
Sin embargo, muchas funciones tienen un argumento na.rm
para removerlos.
sum(c(4, 2, NA), na.rm = T)
## [1] 6
mean(c(4, 2, NA), na.rm = T)
## [1] 3