Librería

ggcorrplot

Autor principal

Alboukadel Kassambara

Datos de muestra

ggcorrplot visualiza matrices de correlacion como graficos ggplot2. Empieza calculando la matriz de correlacion con cor() y opcionalmente la matriz de p-valores con cor_pmat(). Usamos seis variables numericas de mtcars.

# install.packages("ggcorrplot")
library(ggcorrplot)

df         <- mtcars[, c("mpg", "cyl", "disp", "hp", "wt", "qsec")]
cor_matrix <- cor(df)

ggcorrplot()

Pasa la matriz de correlacion a ggcorrplot(). Cada celda se colorea segun el valor de correlacion: azul para positiva, rojo para negativa. La escala de color va de -1 a 1 por defecto.

# install.packages("ggcorrplot")
library(ggcorrplot)

cor_matrix <- cor(df)
ggcorrplot(cor_matrix)

Matriz de correlacion basica con ggcorrplot en R

type

Triangulo superior de la matriz de correlacion con ggcorrplot

Como la matriz es simetrica, mostrar solo la mitad evita la redundancia. Usa type = "upper" para el triangulo superior o type = "lower" para el inferior. El valor por defecto es "full".

# install.packages("ggcorrplot")
library(ggcorrplot)

ggcorrplot(cor_matrix,
           type = "upper")

method

Usa method = "circle" para sustituir los cuadrados coloreados por circulos cuyo tamano representa la fuerza de la correlacion en valor absoluto. Los circulos mas grandes indican correlaciones mas fuertes, lo que facilita identificar las relaciones mas importantes de un vistazo.

# install.packages("ggcorrplot")
library(ggcorrplot)

ggcorrplot(cor_matrix,
           method = "circle")

Matriz de correlacion con circulos en ggcorrplot method circle

Coeficientes de correlacion

Matriz de correlacion con coeficientes numericos en ggcorrplot

Activa lab = TRUE para imprimir el coeficiente de correlacion dentro de cada celda. Ajusta el tamano de la etiqueta con lab_size. Combinalo con type = "upper" para un resultado mas limpio.

# install.packages("ggcorrplot")
library(ggcorrplot)

ggcorrplot(cor_matrix,
           type     = "upper",
           lab      = TRUE,
           lab_size = 3)

Filtrado por p-valor

cor_pmat() calcula una matriz de p-valores para cada par de variables. Pasala a p.mat y define un umbral con sig.level para tachar o dejar en blanco las correlaciones no significativas.

# install.packages("ggcorrplot")
library(ggcorrplot)

p_matrix <- cor_pmat(df)

ggcorrplot(cor_matrix,
           p.mat     = p_matrix,
           sig.level = 0.05)

Matriz de correlacion con filtrado por p-valor en ggcorrplot

Colores

Matriz de correlacion con colores personalizados en ggcorrplot

Pasa un vector de tres elementos a colors para definir los colores de los extremos y el centro de la escala. El primer color se mapea a -1, el segundo a 0 y el tercero a +1. Cualquier color hex o nombre de color de R es valido.

# install.packages("ggcorrplot")
library(ggcorrplot)

ggcorrplot(cor_matrix,
           type   = "upper",
           colors = c("#d73027", "white", "#4575b4"))
MASTER - STATISTICS DOT COM

Master Statistics

Aprende estadística desde lo básico hasta técnicas avanzadas, explicado con claridad

Ir al sitio
R PACKAGES IO

R Packages

Explora y descubre miles de paquetes, funciones y datasets de R

Ir al sitio

También te puede interesar