En un reciente estudio, Bartual-Figueras et al.1 adaptaron y validaron una escala de conciencia de género en el alumnado de ciencias de la salud. Sin embargo, varios aspectos de su metodología y análisis cuestionan en gran medida la validez de sus resultados.
Primeramente, aceptan como válido un modelo de tres factores que no supera el test de ji al cuadrado (ajuste exacto). Este debe ser utilizado porque es el test más poderoso para detectar la mala especificación de un modelo y, si el modelo es correcto, no será rechazado incluso con tamaños de muestra más grandes2. Al no atender al test de ji al cuadrado de su modelo original, son cuestionables también los análisis de invarianza mostrados en la tabla 3. Además, es problemático emplear solo el análisis factorial para validar una escala, sin tener en cuenta el test de un modelo con causas o efectos de esos supuestos factores latentes de la escala3.
Por otro lado, utilizan el alfa de Cronbach de la escala completa (12 ítems) como medida de fiabilidad, cuando es inapropiado su uso4 si existen varias dimensiones (los tres factores reportados por los autores) y no existe tau-equivalencia (como así parece indicar la tabla 1).
Además, calculan el valor medio de los ítems de la escala total (tabla 4) señalando que los participantes mostraron «elevados niveles de conciencia de género». No obstante, en un modelo de indicadores reflectivos (del que parten los autores), los ítems de cada variable latente son intercambiables (se pueden eliminar ítems sin alterar el significado de la variable latente) y el valor de la variable latente se escala mediante una carga factorial igual a 1 con el mejor indicador disponible. Esto hace que, asumiendo la teoría clásica de los test (la esperanza de la varianza de error de cada indicador es cero y no existen causas añadidas que provoquen variación en el indicador) y considerando que la ordenada en el origen también es cero (al medirse todos los ítems en la misma escala Likert que se puede normalizar siempre en un rango [0,1]), la media de la variable latente que se quiere medir coincida con la del mejor indicador. Con una simple manipulación algebraica, bajo estos supuestos, se obtiene que la media del mejor indicador (v34, v39 y v30, para cada uno de los factores) tiene que ser igual a la del resto de los ítems de cada factor dividido por su carga factorial. Solo así se podría calcular esa media que aparece en la tabla 4. Sin embargo, los autores, al computar la media, parecen estar implícitamente asumiendo otro tipo de estructuras de medida, diferentes de las planteadas en su análisis factorial confirmatorio, y similares a las mostradas por Hayduk et al.5 sobre la construcción de índices.
En suma, y pese al esfuerzo encomiable de los autores por adaptar esa escala, existen objeciones metodológicas importantes para aceptar su validez.
Contribuciones de autoríaJosé A. Martínez es el único autor de esta carta.
FinanciaciónNinguna.
Conflictos de interesesNinguno.