Box plot por grupo en R

Datos de muestra

Crear un box plot por grupo en R base es inmediato. En este tutorial vamos a utilizar el siguiente conjunto de datos:

# Conjunto de datos de muestra
set.seed(136)
datos <- data.frame(x = rnorm(300),
                    grupo = sample(LETTERS[1:3],
                                   size = 300,
                                   replace = TRUE))

Gráfico de caja para múltiples grupos

Para crear un box plot por grupo en R puedes pasar una fórmula de la forma y ~ x, siendo x una variable numérica e y una variable categórica, a la función boxplot.

Opción 1

Puedes pasar las variables accediendo a los datos del data frame utilizando el símbolo del dólar o creando un subconjunto del data frame. Este procedimiento es especialmente útil si tus datos están en dos vectores distintos.

boxplot(datos$x ~ datos$grupo)

# Equivalente a:
boxplot(datos[, 1] ~ datos[, 2])

# Equivalente a:
x <- datos$x
y <- datos$grupo
boxplot(x ~ y)

Box plot por grupo en R con la función boxplot()

Opción 2

Otra opción es pasar tu data frame al argumento data, de modo que podrás especificar solo los nombres de las variables de tu conjunto de datos.

boxplot(x ~ grupo, data = datos)

Box plot de tres grupos en R

Color de los box plots por grupo

Colores de un box plot por grupo en R

La función boxplot contiene un argumento llamado col donde puedes especificar un vector de colores de la misma longitud que el número de grupos. Mira la lista de colores o las paletas o usa el generador de paletas.

boxplot(x ~ grupo, data = datos,
        col = c("#FFE0B2", "#FFA726", "#F57C00"))
Fundamentals of Data Visualization

A Primer on Making Informative and Compelling Figures

Comprar en Amazon
ggplot2

Elegant Graphics for Data Analysis

Comprar en Amazon
Storytelling con Datos

Visualización de datos para profesionales

Comprar en Amazon

También te puede interesar