Capítulo 6 Manipulación


“Happy families are all alike; every unhappy family is unhappy in its own way.” — Leo Tolstoy

“Tidy datasets are all alike; but every messy dataset is messy in its own way.” — Hadley Wickham


Proceso estándar

La manipulación de datos es algo primordial en el diagrama del proceso de un proyecto análisis de datos. Este taller se basa en el proceso estándar propuesto por Hadley Wickham.

La etapa de manipulación involucra la importación de datos a R, la limpieza y la transformación constante de los datos para realizar modelos y visualización.

Descarga e instalacion

Para esta sección usaremos las librerías:

  • readr
  • readxl
  • tidyr
  • dplyr

La manera más fácil de instalar los paquetes es usando tidyverse que incluye varios paquetes.

install.packages("tidyverse")
library("tidyverse")