Ejecutar el PCA

Usa prcomp() para ejecutar el PCA sobre las columnas numéricas de tus datos. Establece scale. = TRUE para estandarizar las variables a la misma escala — imprescindible cuando tienen unidades o magnitudes distintas.

pca <- prcomp(iris[, 1:4], scale. = TRUE)

R base: biplot()

La forma más rápida es R base. biplot() superpone las observaciones (etiquetas de fila) y las variables (flechas) en los mismos ejes.

pca <- prcomp(iris[, 1:4], scale. = TRUE)

biplot(pca)

PCA biplot en R base con la función biplot

ggfortify::autoplot()

PCA biplot en ggplot2 con ggfortify autoplot y flechas de variables

ggfortify añade un método para objetos prcomp a autoplot() de ggplot2. Activa loadings = TRUE para dibujar las flechas de las variables y loadings.label = TRUE para etiquetarlas.

# install.packages("ggfortify")
library(ggfortify)

autoplot(pca,
         loadings       = TRUE,
         loadings.label = TRUE)

Color por grupo

Pasa el data frame original a data y mapea una columna de grupos a colour para colorear las observaciones. Las flechas de las variables se dibujan encima.

# install.packages("ggfortify")
library(ggfortify)

autoplot(pca,
         data           = iris,
         colour         = "Species",
         loadings       = TRUE,
         loadings.label = TRUE)

PCA biplot con ggfortify coloreado por especie de iris

factoextra::fviz_pca_biplot()

PCA biplot con factoextra fviz_pca_biplot

factoextra es el paquete más popular para visualizar PCA. fviz_pca_biplot() genera un biplot ggplot2 con flechas etiquetadas y el porcentaje de varianza explicada en los ejes.

# install.packages("factoextra")
library(factoextra)

fviz_pca_biplot(pca)

Grupos y elipses de confianza

Pasa un factor de agrupación a habillage y activa addEllipses = TRUE para dibujar elipses de confianza alrededor de cada grupo. Es la forma más habitual de presentar resultados de PCA en publicaciones.

# install.packages("factoextra")
library(factoextra)

fviz_pca_biplot(pca,
                habillage   = iris$Species,
                addEllipses = TRUE)

PCA biplot con elipses de confianza por grupo usando factoextra

Gráfico de variables

Gráfico de variables PCA coloreado por contribución con factoextra fviz_pca_var

fviz_pca_var() muestra únicamente las flechas de las variables. Usa col.var = "contrib" para colorear cada variable según su porcentaje de contribución a los componentes principales.

# install.packages("factoextra")
library(factoextra)

fviz_pca_var(pca,
             col.var       = "contrib",
             gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"))
MASTER - STATISTICS DOT COM

Master Statistics

Aprende estadística desde lo básico hasta técnicas avanzadas, explicado con claridad

Ir al sitio
R PACKAGES IO

R Packages

Explora y descubre miles de paquetes, funciones y datasets de R

Ir al sitio

También te puede interesar