INTRODUCCIÓN
Diferentes estudios grafican la prevalencia de la agresión en la población adolescente latinoamericana (Silva et al., 2021), incluyendo al Perú (Huamán, 2024; Obregón, 2023; Valle, 2022; Pacheco et al., 2020; Dámaso, 2020). Asimismo, también queda clara la importancia del estudio de la agresión, dada su intrínseca relación con otras variables relevantes en la vida adolescente. Así, se conoce sus vinculaciones con la sintomatología de bulimia nerviosa (Koposov et al., 2023; Quiñones et al., 2022; Osorio y Franco, 2022), el suicido (Detullio et al., 2022; Zhou et al., 2022; Veloso et al., 2023; Chhabria y Khar, 2023; Moore et al., 2023; Khazaie et al., 2023; Xuan et al., 2023), sintomatología depresiva (Ruchkin et al., 2023; Zhou et al., 2023; Bahrami et al., 2021; Zhang et al., 2023; Gordillo et al., 2022; Sfeir et al., 2020; Rahayu y Hamid, 2021), puntuaciones altas de ansiedad (Quiñones et al., 2022; Zhou et al., 2024), adicción al teléfono (Young y Hye, 2022; Deng et al., 2023; Haddad et al., 2021; Ozbay et al., 2022) y con la autoestima (Srinivasan et al., 2022; Yang et al., 2023; Estrada et al., 2021).
Si bien hay cierta uniformidad en cuanto a la conceptualización de la agresión, hay aproximaciones que resaltan más su propósito de lastimar psicológica o físicamente (Huesmann, 1998; Berkowitz, 1996), su fin destructor y correccional (Corsini, 1999) o quebrantador del otro (Worchel et al., 2002), ser realizada por alguien que está en mejores condiciones físicas que el agredido (Hurlock, 1980) o el de ser expresada mediante una conducta que no se hace como norma normalmente apta (Bandura, 1973).
Una de las aproximaciones más relevantes es la desarrollada por Buss (1961), para quien la agresión viene a ser una respuesta que da estímulos perjudiciales a otra entidad. Además, comprende acciones, emociones y formas de actitudes que pueden ser irritables e inapropiadas y que originan estímulos con respuesta agresiva, sin necesidad de proceder con enemistad. La extensión personal de la agresión se manifiesta con recuerdos como agresividad, ira y hostilidad (Buss y Perry, 1992).
En cuanto a la medición de la agresión, resalta en la literatura el Cuestionario de Agresión de Buss y Perry (AQ), creado tomando como base el Inventario de Hostilidad de Buss y Durkee (Buss y Durkee, 1957). Su versión original está conformada por 29 ítems con cinco opciones de respuesta, y se compone de cuatro factores: ira (componente afectivo y fisiológico), hostilidad (componente cognitivo), agresión física y agresión verbal (componentes motores) (Buss y Perry, 1992). No obstante, a pesar de la popularidad y reconocimiento del Cuestionario AQ en la medición de la agresión, se aprecian, en investigaciones posteriores, dificultades al replicar la estructura factorial original (Tarregrosa et al., 2020). Una de ellas fue el estudio de Bryan y Smith (2001), quienes analizaron el modelo de 4 componentes relacionados en muestras obtenidas de distintos países y hallaron valores inaceptables en el análisis factorial confirmatorio (AFC). Se redujo la cantidad de ítems a 12, se mantuvieron los 4 factores originales y se aumentaron las opciones de respuesta de 5 a 6. Esta nueva versión, denominada Cuestionario AQ-SF (Bryan y Smith, 2001), ha sido estudiada en adolescentes en distintos contextos geográficos: en el sudeste asiático, en Singapur (Ang, 2007), en países árabes como en Egipto y Omán (Abd-El-Fattah, 2013), al igual que en Turquía (Kuzucu y Sariot, 2020). Mientras que, en el continente europeo, se identifican estudios en España (Tarregrosa et al., 2020) e Inglaterra (McKay et al., 2016). A pesar de ello, en Latinoamérica, solo se aprecian estudios en lengua portuguesa del modelo, en jóvenes y adultos delincuentes y adultos generales brasileños (Cunha y Gonçalves, 2012; Paiva et al., 2020; Pechorro et al., 2016).
Dentro de los estudios psicométricos del AQ-SF, se resaltan hallazgos que detallaremos a continuación.
En Turquía, se estudió la adaptación al turco del AQ-SF con cinco opciones de respuesta, con la participación de 778 adolescentes entre los 15 a 18 años. Fue subdivida en dos grupos de 383 adolescentes (mujeres=273; hombres=98) para efectuar el análisis exploratorio (AFE) y 395 adolescentes (mujeres=230; hombres=165) para realizar el análisis factorial confirmatorio (AFC). Se evidenció que el modelo de 4 dimensiones representa el 66 % de la varianza total; además, presenta índices de ajuste adecuados en el modelo jerárquico reflectivo compuesto por cuatro factores de primer orden y un factor general de segundo orden (CFI=.98, NFI=.96, AGFI=.93, RMSEA=.05). Presenta cargas factoriales entre .46 a .94 y el ítem 6 tiene menor carga factorial. Sin embargo, no fueron aceptables los índices de fiabilidad en todas sus dimensiones (α= entre .68 a .76; ω= entre .60 a .73); los más bajos fueron en ira y hostilidad (Kuzucu y Sariot, 2020).
En países árabes, se estudió los datos psicométricos del AQ-SF con cinco opciones de respuesta, en dos sub-muestras: la primera fue conformada por 460 adolescentes egipcios [hombres=215 (Medad=16.67, DEedad= 1.32); mujeres=220 (Medad=16.11, DEedad=1.14)] y 410 adolescentes omaníes [hombres=240 (Medad=16.45, DEedad= .98); mujeres=195 (Medad=16.24, DEedad=1.2)]. Se estudió un modelo jerárquico reflectivo compuesto por cuatro factores de primer orden y un factor general de segundo orden, y se evidenció valores inadecuados en la muestra adolescente en Omán [X2/gl= 2.40, CFI=.88; NNFI= .86; SRMR= .09; RMSEA= .09] y Egipto [X2/gl= 2.90, CFI=.89; NNFI= .87; SRMR= .10; RMSEA= .11]. No obstante, se apreció que el AQ-SF es invariante según sexo [ΔCFI entre -.002 a .004]. Por otro lado, se halló valores aceptables de fiabilidad (α= entre .77 a .83) para las dos muestras (Abd-El-Fattah, 2013).
En Singapur se analizó el AQ-SF con 5 opciones de respuesta en dos sub-muestras: la primera compuesta por 331 adolescentes entre los 13 a 17 años (Medad=13.67, DEedad= .66; hombres=171, mujeres=160); mientras que la segunda fue compuesta por 370 adolescentes entre los 10 a 17 años (Medad=12.23, DEedad= 1.52; hombres=176, mujeres=194). Se hallaron aceptables índices de ajuste en el modelo jerárquico reflectivo compuesto por cuatro factores de primer orden y un factor general de segundo orden, tanto en la muestra 1 (X2/gl= 2.89, CFI=.90; GFI= .93; SRMR= .066; RMSEA= .074) y la muestra 2 (X2/gl= 1.94, CFI=.95; GFI= .96; SRMR= .048; RMSEA= .050). En cuanto a la fiabilidad, en la muestra 1, se identifica valores inadecuados en las 4 dimensiones [α= entre .34 a .56]; mientras que en la muestra 2, valores inadecuados en las dimensiones ira y hostilidad [α= entre .55 a .70] (Ang, 2007).
Dentro del territorio español, se investigó la adaptación al español de AQ-SF con cinco opciones de respuesta, en 1202 niños entre 8 y 11 años (Medad=10.09; DEedad= 1.31; Hombres=49 %; Mujeres=51 %). Se evidenciaron adecuados valores en los modelos de 1 dimensión (CFI=.93, TLI=.91, SRMR= .04, RMSEA=.06) y 4 dimensiones correlacionados (CFI=.96, TLI=.95, SRMR= .03, RMSEA=.04) con cargas factoriales entre .39 a .74, y fue mucho menor en el ítem 3. La fiabilidad estuvo entre .61 a .79, y fue inaceptable en la dimensión ira (Tarregrosa et al., 2020).
Come se evidencia, salvo en países árabes, el AQ-SF presenta habitualmente aceptables índices de ajuste en el AFC, pero suele ser recurrente encontrar cargas factoriales menores en los ítems 3 y 6 y problemas con la fiabilidad por dimensiones. Esto también se ve refrendado en estudios con otros grupos poblacionales del AQ-SF, aunque con seis opciones de respuesta, tal y como fue la propuesta original (Bryan y Smith, 2001). Así, en un estudio en preadolescentes españoles, se aprecia que el ítem 3 tiene una carga factorial de .28 y el ítem 6 de .37 (Santisteban y Alvarado, 2009). Situación parecida ocurrió en estudiantes universitarios, en donde el ítem 3 tenía una baja carga factorial de .36 (Valdivia et al., 2014).
Como se ha descrito, ha sido prolífico el estudio del AQ-SF. Esto viene asociado con la cada vez más creciente importancia de tener instrumentos cortos con buenas propiedades psicométricas (Postmes et al., 2013; Alam et al., 2014). Sin embargo, en el contexto peruano, no se ha llevado a cabo ninguna investigación psicométrica de esta versión en población adolescente, aun cuando queda en evidencia el neurálgico papel de la medición de la agresión, dada su vinculación vigente con otras variables relevantes de la vida adolescente (Zhou et al., 2024; Koposov et al., 2023; Deng et al., 2023; Ruchkin et al., 2023; Veloso et al., 2023; Yang et al., 2023; Zhang et al., 2023; Zhou et al., 2023; Quiñones et al., 2022; Detullio et al., 2022, Zhou et al., 2022; Gordillo et al., 2022; Ozbay et al.; 2022; Srinivasan et al., 2022). Por ello, y tomando en cuenta los antecedentes, el presente estudio tuvo como finalidad evaluar, en adolescentes peruanos, las propiedades psicométricas del AQ-SF y de una versión alterna de esta (AQ-SFb), ambas en versiones de 5 y 6 opciones de respuesta.
MÉTODO
Diseño
El estudio tuvo un diseño instrumental, puesto que se orientó al análisis de las propiedades psicométricas de un instrumento de medición ya existente (Sánchez et al., 2018; Ato et al., 2013).
Características de los participantes
Participaron 680 adolescentes de 12 a 17 años, divididos en dos grupos. El grupo 1 (n1) fue conformado por 337 adolescentes, pero se eliminaron las respuestas de 5 de ellos, quedando 332 (Medad= 14.08, DEedad=1.30, de 12 a 14 años = 61.4%, mujeres=55.4%). En el grupo 2 (n2) estuvieron 343 adolescentes, pero se eliminaron 7 participaciones, permaneciendo 336 (Medad= 14.07, DEedad=1.31, de 12 a 14 años = 62.5%, mujeres= 56%). Las 12 participaciones eliminadas fueron consideradas como casos atípicos, tomando en cuenta el D2 con un punto de corte de 32.90 (gl = 12, p< .001) (Tabachnick y Fidell, 2002). El muestreo fue no probabilístico por conveniencia. La cantidad de participantes de ambos grupos fue apreciada como adecuada al superar los 300 considerados como mínimo para estudios instrumentales (Roco et al., 2021).
Instrumento
Se trabaja con el Cuestionario de Agresión de Buss-Perry versión reducida (QA-SF) compuesto por 12 ítems (Bryant y Smith, 2001; Paiva et al., 2020), pero se toma como referencia la adaptación a la realidad peruana de los ítems del AQ [Verbal (6, 14, 18), Hostilidad (8, 12, 16), Física (5, 21, 27) e Ira (3, 22, 25)] (Matalinares et al., 2012). Se utilizaron las siguientes versiones (ver detalle en anexo):
AQ-SF(5op): una versión de 5 opciones de respuesta
AQ-SF(6op): una versión de 6 opciones de respuesta
AQ-SFb(5op): una versión de 5 opciones de respuesta, con omisión de los ítems 3 y 6 e inclusión de los ítems 10 y 11, tomando en cuenta la numeración de ítems de Matalinares et al. (2012)
AQ-SFb(6op): una versión de 6 opciones de respuesta del AQ-SFb(5op)
Procedimiento
Para la versión propuesta del AQ-SF (AQ-SFb), 5 psicólogos con experiencia en la evaluación y tratamiento de adolescentes realizaron una valoración de los ítems del AQ-SF de Bryant y Smith (2001) y Tomaz et al. (2021). Se omitió los ítems 3 y 6 e incluyó los ítems 10 y 11 del AQ de 29 ítems (Matalinares et al., 2012). La evaluación de contenido de esta propuesta estuvo conformada por las categorías de coherencia, relevancia, claridad y suficiencia (Escobar-Pérez y Cuervo-Martínez, 2008). En la versión propuesta (AQ-SFb) se halló coeficientes Kappa de Fleiss casi perfectos (Landis y Koch, 1977) entre .82 y .92 (>.80, p < .05) en las categorías evaluadas. Para la evaluación empírica del AQ-SF original y AQ-SFb se contactó con 4 instituciones educativas y se solicitó la participación voluntaria de los adolescentes, quienes a su vez tenían la autorización de sus padres y/o apoderados. Se enfatizó el carácter privado de la información, asegurando, en todo momento, la confidencialidad y la posibilidad de renunciar a su participación, aun estando en curso (Colegio de Psicólogos del Perú [CPP], 2017). A cada participante se le brindó un cuadernillo que incluía un consentimiento informado, el objetivo instrumental de la investigación, datos sociodemográficos como sexo, grado y edad y el protocolo de evaluación. En cuanto al protocolo, el primer grupo de participantes (n1=332) respondió la versión original del AQ-SF, tanto en las versiones de 5 y 6 opciones de respuesta. El segundo grupo de participantes (n2=336) respondió el AQ-SFb, también en versiones de 5 y 6 opciones de respuesta. Usando hojas de cálculo, se confeccionó bases de datos con las respuestas de los participantes. Estas fueron depuradas, omitiendo participaciones consideradas como datos atípicos (Tabachnick y Fidell, 2002).
Estrategia de análisis de datos
Se usó el programa RStudio v.4.2.1 (R Core Team, 2021). Para el análisis de la normalidad univariada, se consideró aceptable la asimetría y la curtosis en un rango de +/-1.5 (Forero et al., 2009) y que el índice de homogeneidad corregida y comunalidades fueran >.30 (Hu et al., 2021; Lloret-Segura, 2014). Tomando en cuenta el análisis de modelos con variables latentes y la naturaleza ordinal de los ítems, así como la ausencia de normalidad multivariada, es necesaria la selección de estimadores robustos que puedan manejar adecuadamente estas características (Byrne, 2016). Ante ello, se optó por utilizar los estimadores de mínimos cuadrados ponderados robustos (WLSMV) y máxima verosimilitud robusta (MLR), los cuales permiten corregir los sesgos en la estimación de parámetros en modelos de ecuaciones estructurales cuando los datos no cumplen con los supuestos de normalidad multivariada, proporcionando resultados más precisos y robustos (Brown, 2015; Li, 2016).
La evaluación de los índices de ajuste aceptables fue que X²/gl < 5; CFI y TLI ≥ 90; RMSEA (IC95 %) ≤.08; SRMR <.08 (Ruiz et al., 2010; Escobedo et al., 2016). Para el análisis de la invarianza factorial (Wu y Estabrook, 2016) por sexo y grupo de edad, esta se cumplía si las diferencias entre los deltas del RMSEA y CFI eran inferiores a .010 y .015, respectivamente (Pedrero y Manzi, 2020; Cheung y Rensvold, 2002; Chen, 2007). Para la fiabilidad por consistencia interna, los coeficientes α y ω debían superar el .70 para ser considerados aceptables (Viladrich et al., 2017).
RESULTADOS
Análisis descriptivo
Entre las versiones estudiadas, en la tabla 1 se aprecian medias que varían entre 1.83 a 3.93 en el AQ-SF (6op), entre 1.73 a 3.24 en el AQ-SF (5op); al igual que medias entre 1.84 a 4.04 en el AQ-SFb (6op) y entre 1.70 a 3.39 en el AQ-SFb (5op). Ello implica, en su mayoría, una tendencia a marcar puntuaciones bajas en los ítems de la dimensión agresión física, agresión verbal y puntuaciones altas en la dimensión hostilidad. Mientras que, en la dimensión ira, varían las opciones alto y bajo en las versiones del AQ-SFb. Asimismo, todos los ítems cumplen con una normalidad univariada, dado que sus valores de asimetría y curtosis se encuentran en un rango de +/-1.5 (Forero et al., 2009). Por su parte, en su mayoría, los índices de homogeneidad corregida y comunalidades de los modelos estudiados fueron aceptables [>.30], a excepción de los ítems 3 (IHC=.27; h2= 10), 6 (h2= 10) y 16 (h2= 27) de las versiones del AQ-SF, lo cual no ocurre con los ítems 10 y 11 de las versiones del AQ-SFb, los cuales obtuvieron valores aceptables (Hu et al., 2021; Lloret-Segura, 2014).
Normalidad multivariada
Se aprecia ausencia de normalidad multivariada en las cuatro versiones estudiadas, dado que los índices de Mardia de asimetría son mayores a 70 (Rodríguez y Ruiz, 2008). Por ello, se consideró conveniente el uso de los estimadores de distribución no normal como el MLR y WLSMV, por su factibilidad para el análisis de las relaciones estructurales en estas condiciones (Li, 2016; Finney y DiStefano, 2006).
Validez basada en la estructura interna
En la tabla 2, se analizó la validez de las versiones estudiadas del AQ-SF mediante el AFC. De esta forma, se identifica adecuados índices en el AQ-SF (6op) {WLSMV [X2/gl= 2.69; CFI= .98; TLI= .97; RMSEA= .07; SRMR= .04]; MLR [X2/gl= 2.63; CFI= .94; TLI= .92; RMSEA= .07; SRMR= .04]} y el AQ-SF (5op) {WLSMV [X2/gl= 3.34; CFI= .95; TLI= .93; RMSEA= .08; SRMR= .06]; MLR [X2/gl= 2.48; CFI= .92; TLI= .90; RMSEA= .06; SRMR= .05]} (Ruiz et al., 2010; Escobedo et al., 2016). No obstante, a pesar de ello, en estos dos modelos, se aprecian cargas factoriales <.50, en los ítems 3 y 6. Esto no ocurre en las versiones del AQ-SFb, en donde las cargas factoriales de los ítems 10 y 11 es >.50, así como los demás ítems. Así, se identifica adecuados índices en el AQ-SFb (6op) {WLSMV [X2/gl= 2.69; CFI= .97; TLI= .96; RMSEA= .07; SRMR= .04]; MLR [X2/gl= 2.19; CFI= .95; TLI= .94; RMSEA= .06; SRMR= .04]} y el AQ-SFb (5op) con el estimador de MLR [X2/gl= 3.38; CFI= .94; TLI= .92; RMSEA= .06; SRMR= .04], pero con el estimador WLSMV, el RMSEA > .80 (Ruiz et al., 2010; Escobedo et al., 2016).
Tabla 2 Índices de ajuste y cargas facgtoriales de las versiones estudiadas del AQ-SF

Nota: AQ-SF (6op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (6 opciones); AQ-SF (5op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (5 opciones); AQ-SFb (6op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (6 opciones con los ítems 10 y 11); AQ-SFb (5op)= M Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (5 opciones con los ítems 10 y 11); F1= Verbal; F2= Ira; F3= Hostilidad; F4=Físico; CFI= Índice de ajuste comparativo; TLI= Índice de Tucker-Lewis; RMSEA= Error cuadrático medio de aproximación; SRMR= Residuo cuadrático medio estandarizado; X2/gl= Ji cuadrado/ grados de libertad.
Evidencias de equidad
En la tabla 3, se presentan los resultados de la invarianza factorial del AQ-SF (Wu y Estabrook, 2016) en todas las versiones estudiadas, en función de grupo de edad (12 a 14 - 15 a 17 años) y del sexo. No se aprecian cambios significativos en las cargas factoriales, medias, estructuras factoriales y varianza no explicada de los ítems (Pedrero y Manzi, 2020), dado que las diferencias entre los deltas del RMSEA y CFI son inferiores a .010 y .015, respectivamente (Cheung y Rensvold, 2002; Chen, 2007).
Tabla 3 Evidencias de equidad por sexo y grupo de edad de las versiones estudiadas del AQ-SF

AQ-SF (6op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (6 opciones); AQ-SF (5op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (5 opciones); AQ-SFb (6op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (6 opciones con los ítems 10 y 11); AQ-SFb (5op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (5 opciones con los ítems 10 y 11); MI1=Configuracional; MI2= Fuerte; MI3= Métrica; MI4= Estricta; ΔX2= Variación del chi cuadrado; Δgl= Variación de los grados de libertad; ΔCFI= Variación del CFI; ΔRMSEA= Variación del RMSEA
Datos de fiabilidad
En la tabla 4 se identifica los datos de fiabilidad en las versiones estudiadas del AQ-SF. Se aprecia en el AQ-SF (6op) valores de α y ω entre .66 a .76, siendo inaceptable en la dimensión ira. Asimismo, en el AQ-SF (5op) se aprecia valores α y ω entre .56 a .70, no siendo aceptables en las dimensiones agresión verbal e ira. Por otro lado, los datos de fiabilidad de las versiones del AQ-SFb evidencian ser aceptables en todas las dimensiones, con valores de α y ω entre .72 a .80 (Viladrich et al., 2017).
Tabla 4 Fiabilidad por el método de consistencia interna de las versiones estudiadas del AQ-SF

Nota: AQ-SF (6op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (6 opciones); AQ-SF (5op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (5 opciones); AQ-SFb (6op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden (6 opciones con los ítems 10 y 11); AQ-SFb (5op)= Modelo jerárquico reflectivo de 4 factores de primer orden y 1 factor general de segundo orden( 5 opciones con los ítems 10 y 11)); α= Alfa; ω= Omega de McDonald.
DISCUSIÓN
Tomando en cuenta la finalidad de la investigación, se aprecia que el Cuestionario de Agresión en su forma reducida (AQ-SF) (Bryant y Smith, 2001; Tomaz et al., 2021) tiene evidencias de validez basada en la estructura interna por AFC y evidencias de equidad por sexo y grupo de edad, tanto en sus versiones con 5 opciones de respuesta como de 6. Esto coincide con los hallazgos de Kuzucu y Sariot (2020) y Tarregrosa et al. (2020). Sin embargo, como ocurre con tales estudios, no hay evidencias de fiabilidad en todas las dimensiones. En cuanto a la versión propuesta del AQ-SF (AQ-SFb), en donde los ítems 3 y 6 son reemplazados por los ítems 11 y 10, respectivamente, sí se evidencia fiabilidad aceptable en las cuatro dimensiones. Vale destacar que de las versiones propuestas (AQ-SFb), la de seis opciones de respuesta [AQ-SFb (6op)] tiene mayor estabilidad en sus índices de ajuste, independientemente del método de estimación utilizado.
En cuanto al análisis descriptivo de los ítems del AQ-SF en las distintas versiones estudiadas, se halló que todos los ítems cumplen con la normalidad univariada, dado que sus valores de asimetría y curtosis se encuentran en un rango de +/-1.5 (Forero et al., 2009). Por su parte, en las versiones del AQ-SF original, en su mayoría, los IHC y h2, de los modelos estudiados fueron aceptables [>.30] (Hu et al., 2021; Lloret-Segura, 2014), a excepción de los ítems 3 (IHC=.27; h2= 10) y 6 (h2= 10) y 16 (h2= 27). Estas dificultades no ocurren en las versiones del AQ-SFb, en donde se observa valores aceptables en todos los ítems. El funcionamiento controversial del ítem 3 también es apreciado en el estudio en adolescentes turcos de Kuzucu y Sariot (2020), en donde se identifica un valor de IHC de .33.
La evaluación de la evidencia de validez se realizó a través del AFC, y al no cumplirse la normalidad multivariada, se consideró el uso de los estimadores de MLR y WLSMV (Li, 2016; Finney y DiStefano, 2006). En el AQ-SF original se encontró aceptables índices de ajuste, tanto en el AQ-SF (6op) {WLSMV [X2/gl= 2.69; CFI= .98; TLI= .97; RMSEA= .07; SRMR= .04]; MLR [X2/gl= 2.63; CFI= .94; TLI= .92; RMSEA= .07; SRMR= .04]} y el AQ-SF (5op) {WLSMV [X2/gl= 3.34; CFI= .95; TLI= .93; RMSEA= .08; SRMR= .06]; MLR [X2/gl= 2.48; CFI= .92; TLI= .90; RMSEA= .06; SRMR= .05]} (Ruiz et al., 2010; Escobedo et al., 2016). Sin embargo, al analizar los índices de ajuste del AQ-SFb, estos son más estables entre los estimadores usados en la versión de 6 opciones de respuesta [AQ-SFb (6op): WLSMV (X2/gl= 2.69; CFI= .97; TLI= .96; RMSEA= .07; SRMR= .04); MLR (X2/gl= 2.19; CFI= .95; TLI= .94; RMSEA= .06; SRMR= .04)], mientras que en el AQ-SFb (5op), se pierde ajuste en el RMSEA al ser >.80 (Ruiz et al., 2010; Escobedo et al., 2016). Estos hallazgos son similares a los estudios de Ang (2007) en Indonesia {[Muestra 1 (X2/gl= 2.89, CFI=.90; GFI= .93; SRMR= .066; RMSEA= .074); Muestra 2 (X2/gl= 1.94, CFI=.95; GFI= .96; SRMR= .048; RMSEA= .050)]} y Torregrosa et al. (2020) en España (CFI=.96; TLI= .95; SRMR= .035; RMSEA= .048). No obstante, la estructura factorial del AQ-SF tuvo inadecuados valores en adolescentes de Omán [X2/gl= 2.40, CFI=.88; NNFI= .86; SRMR= .09; RMSEA= .09] y Egipto [X2/gl= 2.90, CFI=.89; NNFI= .87; SRMR= .10; RMSEA= .11] (Abd-El-Fattah, 2013).
En cuanto a las cargas factoriales, en el análisis del AQ-SF de las versiones de 5 y 6 opciones de respuesta, se aprecia cargas factoriales <.50 en los ítems 3 y 6. Ello no se refrenda en las versiones del AQ-SFb, donde sí se tiene buenas cargas factoriales, tomando en cuenta el reemplazo de los ítems 3 y 6 por la 11 y 10, respectivamente. Así, en el AQ-SF (6op), las cargas varían entre .62 y .85, mientras que en el AQ-SF (5op) entre .61 y .86. Lo descrito con relación al AQ-SF original se asocia con el estudio de Kuzucu y Sariot (2020), quienes usaron 5 opciones de respuesta, y hallaron cargas factoriales entre .46 a .94, siendo el ítem 6, quien tiene menor carga factorial. Por su parte, en el estudio español de Torregrosa et al. (2020), también de 5 opciones, se identifica la distribución de las cargas factoriales por dimensiones con valores entre .39 a .74, teniendo menor carga factorial el ítem 3.
La evaluación de la propiedad de equidad se realizó a través del análisis de invarianza factorial por sexo y grupo de edad (12 a 14 y 15 a 17 años). En todas las versiones analizadas, de cinco y seis opciones de respuesta, del AQ-SF y del AQ-SFb, se evidencia que ni el grupo de edad ni el sexo al que pertenezcan los participantes afectan las mediciones realizadas de la agresión. Se encontró valores de ΔCFI y ΔRMSEA, menores a .010 y .015 en los diferentes niveles de invarianza (Domínguez-Lara, 2016; Cheung y Rensvold, 2002; Chen, 2007). Estos resultados son similares a los hallados por Kuzucu y Sariot (2020) (ΔCFI entre -.001 a .001 y ΔRMSEA entre -.013 a .001) y el estudio de Abd-El-Fattah (2013) (ΔCFI entre -.002 a .004) en relación al AQ-SF. Ambos estudios también evidenciaron que la medición de la agresión para cada sexo es equivalente.
En relación a la fiabilidad, la evaluación por dimensiones del AQ-SF presenta dificultades. Así, el AQ-SF (6op) presenta valores de α y ω entre .66 a .76, demostrando un valor inaceptable en la dimensión ira. De la misma forma, el AQ-SF (5op) tiene valores α y ω entre .56 a .70, teniendo valores inadecuados en las dimensiones agresión verbal e ira. Por su parte, los datos de fiabilidad de las versiones de 5 y 6 opciones del AQ-SFb, evidencian una mejoría sustancial, teniendo en todas las dimensiones valores de α y ω entre .72 a .80 (Viladrich et al., 2017). Los hallazgos desfavorables encontrados en las versiones del AQ-SF son similares a los de Kuzucu y Sariot (2020), cuyos valores de α y ω estuvieron entre .56 a .70, teniendo valores inadecuados en las dimensiones ira y hostilidad. En el mismo sentido, están los resultados de Torregrosa et al., (2020) y Ang (2007), quienes hallaron valores entre .61 a .79, con valores inaceptables en las dimensiones ira y hostilidad.
La investigación también mantiene limitaciones destacables. A pesar de que el estudio tiene una cantidad muestral aceptable para estudios instrumentales (Roco et al., 2021), el muestreo no probabilístico restringe la posibilidad de generalización poblacional de sus hallazgos. Lo expuesto sienta las bases para tareas futuras con relación al AQ-SF y el AQ-SFb, especialmente la que tiene que ver con la replicación de los hallazgos en otros grupos de adolescentes, usando especialmente un muestreo probabilístico.
Aun cuando lo señalado previamente es digno de destacar, también debe resaltarse que el presente estudio cuenta con importantes fortalezas, expresadas en sus hallazgos. A la espera de futuros estudios, el uso de la versión del AQ-SF (Bryant y Smith, 2001; Tomaz et al., 2021) debe ser cuidadosamente meditada por tener dimensiones con ausencia de fiabilidad aceptable. Por ello, se sugiere, ante la imposibilidad de medir la agresión con el AQ (Buss y Perry, 1992; Matalinares et al., 2012), el uso del AQ-SFb que excluye a los ítems 3 y 6 en favor de incluir los ítems 11 y 10. Esto es así porque se evidencia estabilidad en sus índices de ajuste de estructura interna, fiabilidad por dimensiones y la invarianza por sexo y edad, que permiten efectuar estudios comparativos (Bowen y Masa, 2015; Pendergast et al., 2017). Por último, también se debe señalar que, a nivel instrumental, este estudio es pionero en al análisis AQ-SF en el Perú, dado que es el primero en analizar las evidencias psicométricas de esta versión en el territorio nacional, abriendo la posibilidad de mayores análisis futuros.
CONCLUSIONES
El Cuestionario de Agresión en su forma reducida (AQ-SF), en adolescentes peruanos, tiene evidencia de validez basada en la estructura interna y de equidad por sexo y edad, pero presenta dificultades en la fiabilidad de las dimensiones de agresión verbal e ira. La versión propuesta de este cuestionario (AQ-SFb) tiene evidencias de validez, equidad y fiabilidad, especialmente en un formato de seis opciones de respuesta.