pairs
En R base puedes crear un gráfico de correlación de múltiples variables (por pares) con la función pairs
. Ten en cuenta que utilizar esta función es equivalente a pasar un data frame numérico a la función plot
.
# Variables numéricas
df <- iris[1:4]
pairs(df)
# Equivalente a:
pairs(~ Sepal.Length + Sepal.Width +
Petal.Length + Petal.Width, data = df)
# Equivalente a:
with(df, pairs(~ Sepal.Length + Sepal.Width +
Petal.Length + Petal.Width))
# Equivalente a:
plot(df)
Existen varios argumentos que se pueden utilizar para personalizar la salida. El siguiente bloque de código resalta y describe algunos de los argumentos más relevantes. Escribe ?pairs
para obtener la lista completa.
# Variables numéricas
df <- iris[1:4]
pairs(df, # Datos
pch = 19, # Símbolo pch
col = 4, # Color
main = "Title", # Título
gap = 0, # Distancia entre gráficos
row1attop = FALSE, # Dirección de la diagonal
labels = colnames(df), # Etiquetas
cex.labels = 0.8, # Tamaño textos diagonales
font.labels = 1) # Fuente textos diagonales
El esquema de color se puede personalizar de tal modo que cada grupo de tu conjunto de datos se coloree de un color diferente. Para tal propósito puedes indexar tu variable categórica a una paleta de colores. Revisa la lista de paletas de colores o crea la tuya propia.
# Variables numéricas
df <- iris[1:4]
# Grupos
especies <- iris[, 5]
# Número de grupos
l <- length(unique(especies))
pairs(df, col = hcl.colors(l, "Temps")[especies])
Ten en cuenta que algunos símbolos pch permiten establecer el color de fondo y el borde como en el siguiente ejemplo.
# Variables numéricas
df <- iris[1:4]
# Grupos
especies <- iris[, 5]
# Número de grupos
l <- length(unique(especies))
pairs(df,
pch = 22,
bg = hcl.colors(l, "Temps")[especies],
col = hcl.colors(l, "Temps")[especies])
También te puede interesar