Datos de muestra

Crear un box plot por grupo en R base es inmediato. En este tutorial vamos a utilizar el siguiente conjunto de datos:

# Conjunto de datos de muestra
set.seed(136)
datos <- data.frame(x = rnorm(300),
                    grupo = sample(LETTERS[1:3],
                                   size = 300,
                                   replace = TRUE))

Gráfico de caja para múltiples grupos

Para crear un box plot por grupo en R puedes pasar una fórmula de la forma y ~ x, siendo x una variable numérica e y una variable categórica, a la función boxplot.

Opción 1

Puedes pasar las variables accediendo a los datos del data frame utilizando el símbolo del dólar o creando un subconjunto del data frame. Este procedimiento es especialmente útil si tus datos están en dos vectores distintos.

boxplot(datos$x ~ datos$grupo)

# Equivalente a:
boxplot(datos[, 1] ~ datos[, 2])

# Equivalente a:
x <- datos$x
y <- datos$grupo
boxplot(x ~ y)

Box plot por grupo en R con la función boxplot()

Opción 2

Otra opción es pasar tu data frame al argumento data, de modo que podrás especificar solo los nombres de las variables de tu conjunto de datos.

boxplot(x ~ grupo, data = datos)

Box plot de tres grupos en R

Color de los box plots por grupo

Colores de un box plot por grupo en R

La función boxplot contiene un argumento llamado col donde puedes especificar un vector de colores de la misma longitud que el número de grupos. Mira la lista de colores o las paletas o usa el generador de paletas.

boxplot(x ~ grupo, data = datos,
        col = c("#FFE0B2", "#FFA726", "#F57C00"))

También te puede interesar