Capítulo 6 Manipulación
“Happy families are all alike; every unhappy family is unhappy in its own way.” — Leo Tolstoy
“Tidy datasets are all alike; but every messy dataset is messy in its own way.” — Hadley Wickham
Proceso estándar
La manipulación de datos es algo primordial en el diagrama del proceso de un proyecto análisis de datos. Este taller se basa en el proceso estándar propuesto por Hadley Wickham.
La etapa de manipulación involucra la importación de datos a R, la limpieza y la transformación constante de los datos para realizar modelos y visualización.
Descarga e instalacion
Para esta sección usaremos las librerías:
readr
readxl
tidyr
dplyr
La manera más fácil de instalar los paquetes es usando tidyverse
que incluye varios paquetes.
install.packages("tidyverse")
library("tidyverse")