Sesión 8: Extracción, Rotación e Interpretación de Factores
2025-05-19
Continuando con nuestro estudio del Análisis Factorial Exploratorio (AFE):
En la sesión anterior, nos enfocamos en la Preparación de Datos y Evaluación de Supuestos.
Hoy avanzamos hacia la Extracción e Interpretación de los Factores.
Antes de la extracción, la selección cuidadosa de las variables (ítems) es fundamental.
Consideraciones Clave:
Este es uno de los pasos más críticos y subjetivos del AFE. Extraer muy pocos factores puede sobresimplificar la estructura; extraer demasiados puede llevar a factores poco sustantivos o difíciles de interpretar.
No hay una regla única, se usan múltiples criterios:
(Los índices de ajuste como AIC, BIC, RMSEA son más propios de AFC o AFE con ML, pero pueden dar pistas).
Ventaja: Simple y objetivo. Desventaja: Tiende a sobresestimar (extraer demasiados) o a veces subestimar el número de factores. Usar con precaución y junto a otros criterios.
Es un método gráfico:
Ejemplo de Scree Plot: El “codo” parece estar después del 2do o 3er factor.
Ventaja: Intuitivo. Desventaja: A veces es ambiguo dónde está el “codo” (puede haber varios o ninguno claro).
Considerado uno de los métodos más robustos y precisos.
Ventaja: Más objetivo y menos propenso a sobre/subestimación que Kaiser o Scree Plot solo. Desventaja: Más complejo de calcular manualmente (pero fácil con software).
Una vez decidido el número de factores, se elige un método para “extraerlos” (estimar las cargas factoriales).
fa() en R con fm="minres" (Mínimos Cuadrados Residuales, por defecto), fm="pa" (Ejes Principales), fm="uls" son opciones robustas.La solución factorial inicial (matriz de cargas sin rotar) a menudo es difícil de interpretar:
* Muchas variables pueden tener cargas moderadas en múltiples factores.
* Es difícil ver qué variables definen claramente cada factor.
Objetivo de la Rotación: Transformar matemáticamente los ejes de los factores en el espacio multidimensional para obtener una estructura más simple e interpretable, donde:
* Cada variable cargue alto en un solo factor (o muy pocos).
* Cada variable cargue bajo (cercano a cero) en los demás factores.
* Cada factor esté definido por un conjunto claro de variables.
Importante: La rotación no cambia la cantidad total de varianza explicada por la solución factorial ni las comunalidades de las variables. Solo redistribuye la varianza entre los factores rotados.
La elección depende de si teóricamente esperamos que los factores latentes estén o no correlacionados entre sí.
Recomendación: A menudo es bueno probar ambas y ver cuál da la solución más interpretable y teóricamente coherente. Si la correlación entre factores en una rotación oblicua es muy baja (ej. < |0.2| o |0.3|), la solución ortogonal puede ser preferible.
Después de la extracción (y usualmente rotación), obtenemos la matriz de cargas factoriales.
* Filas: Variables observadas (ítems).
* Columnas: Factores latentes extraídos.
* Celdas (\(\lambda_{ij}\)): La carga factorial de la variable \(i\) en el factor \(j\).
Interpretación de una Carga Factorial (\(\lambda_{ij}\)):
* Indica la fuerza y dirección de la relación lineal entre la variable observada \(X_i\) y el factor latente \(F_j\).
* Si la matriz es de correlaciones (variables estandarizadas), \(\lambda_{ij}\) es la correlación entre el ítem y el factor.
* \((\lambda_{ij})^2\): Es la proporción de varianza de la variable \(X_i\) que es explicada por el factor \(F_j\).
Ejemplo (Matriz NO Rotada): Podría ser confusa.
El objetivo es lograr una “Estructura Simple”:
Una vez obtenida una solución factorial (número de factores, cargas), ¿cómo sabemos si es “buena”?
(Estos índices son más centrales en AFC, pero se reportan en AFE con ML).
Una vez validada la estructura factorial, a menudo queremos asignar a cada individuo un puntaje que represente su nivel en cada uno de los factores latentes identificados.
psych::fa() es “Thurstone” (basado en regresión).Las puntuaciones factoriales convierten los factores latentes en “variables” que podemos usar en análisis posteriores:
Precaución: Recordar que son estimaciones de los factores latentes, no los factores en sí. Tienen un grado de indeterminación.
En el práctico:
