ggcorrplot visualiza matrices de correlacion como graficos ggplot2. Empieza calculando la matriz de correlacion con cor() y opcionalmente la matriz de p-valores con cor_pmat(). Usamos seis variables numericas de mtcars.
# install.packages("ggcorrplot")
library(ggcorrplot)
df <- mtcars[, c("mpg", "cyl", "disp", "hp", "wt", "qsec")]
cor_matrix <- cor(df)
ggcorrplot()
Pasa la matriz de correlacion a ggcorrplot(). Cada celda se colorea segun el valor de correlacion: azul para positiva, rojo para negativa. La escala de color va de -1 a 1 por defecto.
# install.packages("ggcorrplot")
library(ggcorrplot)
cor_matrix <- cor(df)
ggcorrplot(cor_matrix)

type

Como la matriz es simetrica, mostrar solo la mitad evita la redundancia. Usa type = "upper" para el triangulo superior o type = "lower" para el inferior. El valor por defecto es "full".
# install.packages("ggcorrplot")
library(ggcorrplot)
ggcorrplot(cor_matrix,
type = "upper")
method
Usa method = "circle" para sustituir los cuadrados coloreados por circulos cuyo tamano representa la fuerza de la correlacion en valor absoluto. Los circulos mas grandes indican correlaciones mas fuertes, lo que facilita identificar las relaciones mas importantes de un vistazo.
# install.packages("ggcorrplot")
library(ggcorrplot)
ggcorrplot(cor_matrix,
method = "circle")


Activa lab = TRUE para imprimir el coeficiente de correlacion dentro de cada celda. Ajusta el tamano de la etiqueta con lab_size. Combinalo con type = "upper" para un resultado mas limpio.
# install.packages("ggcorrplot")
library(ggcorrplot)
ggcorrplot(cor_matrix,
type = "upper",
lab = TRUE,
lab_size = 3)
cor_pmat() calcula una matriz de p-valores para cada par de variables. Pasala a p.mat y define un umbral con sig.level para tachar o dejar en blanco las correlaciones no significativas.
# install.packages("ggcorrplot")
library(ggcorrplot)
p_matrix <- cor_pmat(df)
ggcorrplot(cor_matrix,
p.mat = p_matrix,
sig.level = 0.05)


Pasa un vector de tres elementos a colors para definir los colores de los extremos y el centro de la escala. El primer color se mapea a -1, el segundo a 0 y el tercero a +1. Cualquier color hex o nombre de color de R es valido.
# install.packages("ggcorrplot")
library(ggcorrplot)
ggcorrplot(cor_matrix,
type = "upper",
colors = c("#d73027", "white", "#4575b4"))
Aprende estadística desde lo básico hasta técnicas avanzadas, explicado con claridad
Ir al sitio
También te puede interesar