En el ámbito de la investigación psicológica suelen utilizarse definiciones de la impulsividad que refieren a la falta de autocontrol, al retraso deficiente de las gratificaciones, a la falta de control de los impulsos o la conducta de toma de riesgos, las cuales suelen ser similares a las utilizadas para definir otro rasgo de la personalidad como el autocontrol (Garrido et al., 2017; Khurana & Romer, 2019). Sin embargo, la impulsividad es un constructo específico que se manifiesta en acciones no planificadas e irreflexivas (Moeller et al., 2001). En este sentido, Whiteside y Lynam (2001) propusieron unificar la medición de la impulsividad mediante un modelo al que denominaron UPPS. El modelo UPPS este compuesto por cuatro dimensiones: urgencia negativa, (falta de) premeditación, (falta de) perseverancia y búsqueda de sensaciones. Esta estructura original fue modificada por Cyders et al. (2007), quienes incorporaron una quinta dimensión denominada urgencia positiva y que dio origen a la escala de impulsividad que en la actualidad se conoce bajo las siglas UPPS-P.
En la escala UPPS-P, la dimensión urgencia negativa refiere a la tendencia a cometer acciones precipitadas como resultado de un intenso afecto negativo. Mientras que la dimensión (falta de) premeditación alude a la falta de planificación o de un pensamiento cuidadoso y deliberado previo a la acción. Por su parte, la dimensión (falta de) perseverancia remite a la incapacidad de persistir en tareas aburridas o difíciles. Con respecto a la dimensión búsqueda de sensaciones, esta se conceptualiza como la tendencia a buscar y disfrutar actividades emocionantes o excitantes (Whiteside & Lynam, 2001). Por último, la dimensión urgencia positiva se define como la tendencia a actuar precipitadamente o de forma inadaptada en respuesta a los estados de ánimo positivos.
Si bien la escala UPPS-P fue ampliamente utilizada para evaluar conductas de naturaleza impulsiva en jóvenes y adultos (Cyders et al., 2007), en años recientes se adaptó la escala UPPS-P a población adolescente (Gunn & Smith, 2010; Zapolski et al., 2010). Entre las razones que motivaron esta adaptación se puede mencionar en primer lugar, que a nivel teórico y empírico se demostró que durante la niñez y la adolescencia es posible evaluar de forma confiable y valida los rasgos de personalidad como la impulsividad (Measelle et al., 2005; Wright & Jackson, 2022; Zapolski et al., 2010). En segundo lugar, se evidenció que durante la adolescencia existen conductas desadaptativas (e.g., externalizadas e internalizadas) que se asocian con rasgos impulsivos de la personalidad (Zapolski & Smith, 2013; Wang et al., 2020). Con relación a esto último, estudios previos de investigación reportaron que durante la adolescencia las dimensiones urgencia negativa, búsqueda de sensaciones y urgencia positiva suelen asociarse con conductas como la agresión, el vandalismo, la desobediencia ante las normas sociales y el robo (Maneiro et al., 2017). Asimismo, estas dimensiones junto a la dimensión (falta de) perseverancia se asocian al consumo de marihuana en adolescentes (VanderVeen et al., 2016). Mientras que la dimensión (falta de) perseverancia y (falta de) premeditación en adolescentes suelen asociarse con el malestar psicológico, la ansiedad, la depresión y el riesgo suicida (López Steinmetz et al., 2020).
La versión adaptada para población adolescente de la UPPS-P, denominada UPPS-R-Child Version (UPPS-R-C) en algunos estudios (Tomko et al.,2016; Zapolski et al., 2010) y UPPS-P-Child Version (UPPS-P-C) en otros (Gunn & Smith, 2010; Zapolski & Smith, 2013) fue desarrollada por Zapolski et al. (2010); quienes evaluaron cuatro de las cinco dimensiones del modelo UPPS-P (sin el factor urgencia positiva). Para adaptar la escala de impulsividad, los ítems fueron reducidos en cantidad (de 45 a 32 ítems) y en extensión (frases breves), como asi también se reformuló el contenido de los ítems para adecuarlos a la población de niños y adolescentes (Zapolski et al., 2010). Los resultados del análisis de confiabilidad indicaron valores en el índice de alfa de Cronbach superiores a .80 para las cuatro dimensiones. Asimismo, comprobaron que la versión adaptada posee evidencia de validez de constructo y predictiva (Zapolski et al., 2010). De igual modo, Gunn y Smith (2010) replicaron la estructura factorial de la UPPS-P-C (considerando urgencia positiva) y comprobaron que el ajuste estadístico del modelo de cinco factores de la UPPS-P-C es adecuado (CFI = .93; RMSEA = .06, IC 90 % [.05, .06]). Con respecto a los análisis de confiabilidad, Gunn y Smith (2010) indicaron que la escala presentó valores del índice alfa de Cronbach entre .65 (falta de perseverancia) y .85 (urgencia negativa). En relación con la validez, los autores indicaron que la escala posee adecuada validez predictiva.
En un estudio reciente, Tomko et al. (2016) indicaron que el modelo de 5 factores de la UPPS-P-C presentó un ajuste adecuado del modelo de medida a los datos (CFI = .89; RMSEA = .08; IC 95 % [.08, .09]). Además, reportaron que los índices de confiabilidad variaron entre α = .79 (falta de premeditación) y α = .95 (urgencia positiva). En Argentina, Caneto et al. (2020) encontraron que la estructura de cinco factores de la UPPS-P-C posee un ajuste del modelo de medida adecuado (CFI = .90; TLI = .89; RMSEA = .06). Asimismo, informaron que los índices de confiabilidad compuesta fueron desde ω = .68 (falta de perseverancia) hasta ꞷ = .91 (urgencia positiva). Con respecto a la validez de UPPS-P-, Caneto et al. (2020) obtuvieron evidencia de validez convergente para las dimensiones urgencia negativa y positiva y evidencia de validez discriminante para la dimensión urgencia positiva.
Como se demostró en estudios previos (Maneiro et al., 2017; VanderVeen et al., 2016), durante la adolescencia se pueden observar asociaciones entre cada una de las dimensiones del modelo UPPS-P y conductas de riesgo o desadaptativas. Por este motivo, resulta de interés en el campo de investigación o de la práctica profesional (e.g., clínica), contar con un instrumento que evalúe de manera correcta la multidimensionalidad de la impulsividad (Donati et al., 2021) y además, permita valorar de manera precisa la asociación entre las dimensiones de la impulsividad y la conducta adolescente (VanderVeen et al., 2016). Considerando la importancia de contar con medidas de autoreporte diseñadas específicamente para evaluar impulsividad en adolescentes y que cumplan con los estándares de la psicometría actual, el objetivo del presente estudio es analizar las propiedades psicométricas de la escala extensa de la UPPS-P para adolescentes y niños desde el modelo politómico de Rasch. Para cumplir con este objetivo se evaluará el cumplimiento de los supuestos de unidimensional de cada factor, la independencia local, el funcionamiento diferencial de los ítems, el ajuste de los ítems y el nivel de confiabilidad de la prueba. Asimismo, se calcularon los valores transformados de las puntuaciones de la escala ordinal a una escala de intervalo de las cinco dimensiones de la UPPS-P-C.
Método
Participantes
La muestra estuvo compuesta por 800 adolescentes de los cuales el 480 (60%) fueron mujeres y 320 (40%) fueron varones. Sus edades estuvieron comprendidas en un rango que fue desde los 12 hasta los 18 años (M = 13.99; DE = 1.30). Del total de participantes que formaban parte del estudio, un 60% concurrió a una escuela de gestión privada y un 40% a una escuela de gestión pública. Al momento del estudio, el 27 % se encontraba cursando primer año, el 24.2 % segundo año, el 24.9 % tercer año y el 3.9 % el cuarto año del nivel secundario del sistema educativo de la República Argentina.
Procedimiento
Para realizar el presente estudio de investigación se concurrió a establecimientos estatales de gestión pública y privada y se solicitó una entrevista con los directores de cada uno de los establecimientos para obtener el permiso institucional. Una vez hecho esto, se le envió en el cuaderno de comunicaciones una nota donde se le informaba al padre/madre/o tutor legal, quienes eran los responsables académicos. En aquellos casos en los cuales, tanto los padres o tutores legales como los adolescentes, manifestaban su acuerdo y consentimiento para participar en el estudio de investigación se los integraba a la muestra. Siguiendo las disposiciones de la legislación de la República Argentina (Ley N° 25.326, 2000) y los lineamientos para el comportamiento ético en Psicología de la American Psychological Association (APA, 2002), se les informo a la madre/padre o tutor legal y al adolescente los objetivos del estudio de investigación, que todos los datos obtenidos serían confidenciales, que su participación era voluntaria, que esta investigación no conllevaba ningún tipo de riesgo evidente y que en cualquier momento del estudio podían retirarse. La administración de los cuestionarios se realizó en un tiempo aproximado de 20 minutos de manera presencial durante el horario de clases. La recolección de los datos estuvo a cargo de uno de los autores del presente estudio quien permaneció en el aula para responder las dudas de los participantes y garantizar la uniformidad en la administración de la prueba.
Instrumento
Escala de Impulsividad UPPS-P para niños, niña y adolescentes (UPPS-P-C; Zapolski et al. 2010; Gunn & Smith, 2010). La escala UPPS-P-C es un instrumento que a partir de 40 ítems que van desde 1= “muy poco parecido a mí” hasta 4 = “muy parecido a mí” valora las dimensiones urgencia negativa, (falta de) premeditación, perseverancia (falta de), búsqueda de sensaciones y urgencia positiva. Se utilizo la versión en español propuesta por Caneto et al. (2020) quienes reportaron valores aceptables en los indicadores que utilizaron para evaluar la validez convergente y discriminante. Dicho estudio reportó el coeficiente de confiabilidad compuesta, cuyos valores variaron desde ꞷ = .68 en la dimensión (falta de) perseverancia hasta ꞷ = .91 en la dimensión urgencia positiva.
Análisis de datos
El software RUMM2030 se utilizó para realizar los análisis de Rasch para cada una de las 5 dimensiones de la escala UPPS-P-C. Para evaluar los supuestos teóricos del modelo matemático de Rasch (Rasch, 1960) se empleó el modelo de parametrización de crédito parcial, el cual se eligió considerando los resultados de la prueba de Fisher´s Likelihood que fue menor a .05 (Tennant & Conaghan, 2007). Para definir el cumplimiento de los supuestos del instrumento de medición se evaluaron los siguientes indicadores de ajuste para la versión con los ítems completos y se presenta los ajustes para una versión con modificaciones.
Ajuste del modelo de Rasch
Se evaluó la media (M) y desviación estándar (DE) de los valores residuales de los ítems y las personas. Fueron considerados valores adecuados aquellos cercanos a 0 para la media y cercanos a 1 para la desviación estándar. También, se consideró que la interacción entre los ítems y el rasgo latente presente un χ2 no significativo (p >.05 con la corrección de Bonferroni) (Andrich & Marais, 2019). Considerando que el χ2 es un índice sensible al tamaño de la muestra se calculó de manera complementaria el error cuadrático medio de aproximación (RMSEA) (Tennant, & Pallant, 2012). Los valores inferiores a .05 indica un ajuste adecuado, menores a .08 un ajuste razonable y valores superiores a .08 un ajuste inadecuado (Browne & Cudeck, 1992).
Análisis de las categorías de respuesta
Se evaluó si las categorías de respuesta se encontraban ordenadas de forma secuencial (Andrich & Marais, 2019), ya que para que un ítem se considere adecuadamente ajustado, se espera que en todo el rango del rasgo medido cada opción de respuesta tenga sistemáticamente la probabilidad de ser elegida (Tennant & Conaghan, 2007). Cuando los umbrales se encuentran desordenados, por lo general, el colapso de las categorías mejora el ajuste general del modelo (Pallant, & Tennant, 2007).
Ajuste residual de los ítems y de las personas
Se consideró un ajuste adecuado de los ítems y de las personas cuando el valor de los residuos estandarizados se encontraba dentro del rango ±2.5, o cuando poseían un valor de chi-cuadrado no significativo (χ2; p > 0.05 con la corrección de la prueba de Bonferroni). Cuando se encontró que una persona no cumplía con alguno de estos criterios se procedió a eliminarlo del análisis de los datos. Cabe mencionar que, desde el enfoque de la TRI, suele optarse por la eliminación de casos por el incumplimiento de los criterios estadísticos antes mencionados. Esto es debido a que el ajuste del modelo suele estar influenciado por los valores desajustados o extremos de algunas pocas observaciones, por lo que, en algunos casos, se recomienda restar peso a las personas con valores extremos para mejorar las estimaciones del ajuste del modelo (Keeves & Masters, 1999; Linacre, 2010). En el caso particular de los ítems, si los valores de sus residuos estandarizados estuvieron fuera del rango ±2.5, si presentaron un valor de chi-cuadrado no significativo o si al inspeccionar la curva característica de los ítems (CCI) se observó un notorio desajuste, se evaluó el ajuste del modelo general eliminando el ítem que incumple estos criterios (Hamilton et al., 2015).
Independencia local
Se analizó la matriz de correlación residual y se determinó la dependencia entre los ítems cuando presentaron correlaciones residuales superiores a .20. Una solución frente a la presencia de dependencia local es generar super-ítems, para agrupar aquellos ítems que presentan una asociación más allá del constructo latente dominante (Marais & Andrich, 2008).
Funcionamiento diferencial del ítem (DIF)
Considerando las recomendaciones técnicas para el tratamiento de cada uno de los tipos de DIF, se decidió dividir los ítems con DIF uniforme considerando la calibración de los ítems según el sexo de los participantes (hombre y mujer) y eliminar aquellos ítems que presenten DIF no uniforme (Tennant. & Conaghan, 2007).
Confiabilidad
La confiabilidad de la escala se evaluó a partir del índice alfa de Cronbach (α) y del Índice de Separación de Personas (PSI) (Andrich & Marais, 2019). Para interpretar sus resultados se consideró que un valor igual a .70 era aceptable, un valor igual a .80 bueno y un valor igual o mayor a .90 era excelente. Además, para obtener evidencia complementaria al PSI, se calcularon los niveles de habilidad que mide la escala (DLPA, por sus siglas en inglés) y luego a partir de su resultado, se calculó el índice de separación de la persona independiente de la distribución (DI-PSI, por sus siglas en inglés) (Wright, 2001). El DI-PSI puede ser útil para muestras sesgadas en las que los valores del PSI son subestimados y el DLPA indica el número de niveles del rasgo que la escala puede distinguir independientemente de la distribución de la muestra.
Targeting
Para evaluar si el rango que la escala mide del constructo latente coincide con la distribución de las habilidades de las personas (Fisher, 2007) se inspeccionó visualmente el gráfico de distribución de los umbrales y las persona (Person-item threshold distribution) y se evaluó la localización media de las personas. En este caso mientras más cercano a 0 se encuentre el valor de la media mejor sería el targeting o posicionamiento (Tennant & Conaghan, 2007). Además, de manera complementaria se analizó el Targeting Index (TI) que se interpretó como adecuado cuando el valor del índice se encontró en el rango -1 a +1, y como aceptable cuando su valor se encontró en el rango -2 a + 2.
Unidimensionalidad
Se empleó el análisis de componentes principales (PCA) para analizar los residuos y determinar si existían signos de multidimensionalidad. El PCA permitió identificar en el primer residuo dos subconjuntos de ítems, uno con carga factorial positiva y otra negativa, que permitieron evaluar la ubicación de las personas en la escala logit (Pallant & Tennant, 2007). Luego, estos subconjuntos de ítems fueron comparados entre sí mediante una prueba t emparejada y se determinó la unidimensionalidad de la escala cuando el nivel de significatividad de la prueba (p < .05) es inferior al 5% (Smith, 2002).
Finalmente, se calcularon los valores transformados de las puntuaciones de la escala ordinal a una escala de intervalo.
Resultados
Urgencia negativa
Los ítems que conforman esta dimensión presentaron valores fuera de los criterios recomendados para el ajuste de las personas, de los ítems y un χ2 significativo lo que puede indicar un mal ajuste de algunos ítems (Tabla 1). Además, se observaron umbrales desordenados en el ítem 13. Los análisis a nivel de ítems mostraron valores residuales ± 2.5 para los ítems 1 y 32 y valores χ2 y F significativos en los ítems 1, 21, 32 y 39 (Tabla 2). El análisis a nivel de persona (N = 800) reveló que existían 2 (0.25 %) casos perdidos, 25 (3.16 %) casos extremos y 25 (3.13%) casos con valores residuales superiores a ± 2,5. La matriz de correlación residual no mostró asociación entre los ítems. Se identificó un DIF uniforme para el ítem 13, en el cual las mujeres mostraron puntuaciones más elevadas que los varones. Con respecto a la confiabilidad, los índices PSI, alfa de Cronbach y el DI-PSI fueron superiores a .75. En lo que respecta al targeting, el IT (Tabla 1) y el gráfico de distribución de los umbrales de los ítems y de las personas (Figura 1), mostraron que la escala estaba ajustada a la población objetivo con una distribución muestral de -3,26 a +3,10 logits. Como se ve en la Tabla 1, esta dimensión presentó un valor aceptable en relación con el supuesto unidimensional.
Para mejorar el ajuste del modelo se realizaron nuevos análisis que consistieron en colapsar las categorías dos y tres (pasó de 1234 a 1223) del ítem 13, eliminar los ítems 1 y 32 y eliminar 20 casos con ajuste residual atípico. Como resultado de las modificaciones, se obtuvo una nueva versión que presento un mejor ajuste del modelo inicial (Tabla 1), de las personas y de los ítems (Tabla suplementaria 1). No se encontraron umbrales desordenados y tampoco dependencia entre los ítems. Además, todos los ítems presentaron valores residuales entre ±2.5. Sin embargo, el ítem 13 mantuvo un DIF según el sexo y los ítems 37 y 39 un DIF no uniforme. Los índices de confiabilidad si bien presentaron una disminución, indicaron precisión de medición a nivel individual (Tabla 1).
Nota. M = media; SD = desviación estándar; χ2 = chi-cuadrado; df = grados de libertad; p = valor de probabilidad corregido por Bonferroni para el chi-cuadrado; RMSEA = error cuadrático medio de aproximación; SEM = error estándar de la medición; T.I = Targeting index; PSI = índice de separación de las personas; DLPA = niveles de habilidad que mide la escala; DI-PSI = índice de separación de la persona independiente de la distribución (basado en el DLPA); per C <5% = proporción de pruebas t emparejadas que fueron significativas al nivel de significación de .05.
Nota. Se marcaron en negrita aquellos valores que no cumplen con los criterios recomendados para un ajuste
adecuado de los ítems. SE = Desviación estándar; χ2 = chi-cuadrado
Búsqueda de Sensaciones
Esta dimensión presento un desajuste de los ítems, de las personas y un χ2 significativo (Tabla 1). Se observaron umbrales desordenados en los ítems 2, 9, 17, 26 y 33. Los análisis a nivel de ítems mostraron valores residuales de ± 2.5 solo para el ítem 33 y valores χ2 y F significativos en los ítems 2, 17 y 33 (Tabla 3). El análisis a nivel de persona (N = 800) reveló que no existían valores perdidos, que 9 (1.12%) casos tenían valores extremos y 25 (3,16 %) tenían valores residuales mayores a ±2,5. La matriz de correlación residual no mostró asociación entre los ítems. Además, se identificó en los ítems 2, 26 y 38 la presencia de DIF uniforme. En el ítem 2, las mujeres presentaron valores más elevados en comparación con los varones. Mientras que en los ítems 26 y 38 los varones presentaron valores superiores a las mujeres. Con respecto a la confiabilidad, los índice PSI, alfa de Cronbach y el DI-PSI fueron superiores a .70. El targeting de la escala presento un valor adecuado en el IT (Tabla 1) y el gráfico de distribución de los umbrales de los ítems y de las personas (Figura 1), mostró que la escala poseía una distribución muestral de -3,10 a +2,989 logits. Con respecto a la unidimensionalidad, se encontró un valor inferior a 5%, lo que indica el cumplimiento de este supuesto.
Para mejorar el ajuste estadístico del modelo se colapsó las categorías dos y tres (1223) de los ítems 2, 9, 17, 26 y 33 y se eliminaron 25 casos que presentaron un ajuste residual atípico. Luego se eliminó el ítem 33 y tras su eliminación se debió ordenar los umbrales de respuesta (1223) del ítem 38. Además, se dividió en hombres y mujeres los tres ítems que presentaron un DIF uniforme sin obtener un aumento del ajuste del modelo. Luego de las modificaciones realizadas, se obtuvo una versión modificada en la cual la mayoría de los indicadores del ajuste de los ítems (Tabla suplementaria 2) y del modelo politómico de Rasch mejoraron, no se encontraron umbrales desordenados y tampoco dependencia entre los ítems. Asimismo, todos los ítems presentaron valores residuales inferiores a ±2.5. Sin embargo, los ítems que en un comienzo presentaron un DIF uniforme se mantuvieron y se les agregó el ítem 22. El índice PSI fue inferior a lo aceptable y se encontró que se cumplió el supuesto de unidimensionalidad (Tabla1).
Nota. Se marcaron en negrita aquellos valores que no cumplen con los criterios recomendados para un ajuste adecuado de los ítems. SE = Desviación estándar; χ2 = chi-cuadrado
Perseverancia (falta de)
En la Tabla 1 puede observarse que inicialmente los ítems y las personas presentaron valores desajustados. Además, se obtuvo un χ2 significativo y no se observaron umbrales desordenados. Los análisis a nivel de ítems mostraron valores residuales para los ítems 6, 11 y 16 y valores χ2 y F significativos (Bonferroni a α ≤ .05) en los ítems 3, 6, 16,18 y 29 (Tabla 4). El análisis a nivel de persona (N = 800) reveló que no existían valores ausentes, que 10 (1.25%) casos presentaron valores extremos y 21 casos (2.66 %) tuvieron valores residuales superiores a ± 2,5. La matriz de correlación residual mostró asociación entre los ítems 3 y 18 (.24) y entre los ítems 23 y 27 (.24). Se identificó un DIF uniforme en el ítem 18, donde las mujeres presentaron valores más elevados que los hombres mientras que en el ítem 27 los hombres presentaron valores más altos que las mujeres. El TI (Tabla 1) y el gráfico de distribución de los umbrales de los ítems y de las personas (Figura 3), mostraron que la escala poseía un adecuado targeting con una distribución muestral de -3,63 a +3,57 logits. Como se ve en la Tabla 1, esta dimensión presentó un valor igual al 5% en el análisis de unidimensionalidad.
Teniendo en cuenta estos resultados se eliminaron 21 casos que presentaron desajuste residual, se crearon super-ítem entre aquellos ítems que presentaron dependencia local, aunque esta estrategia no mejoro el ajuste del modelo. Además, se dividieron los ítems 18 y 27 para hombres y mujeres, sin obtener resultados satisfactorios. Por último, se procedió a eliminar los ítems 6, 11 y 16. Luego de estas modificaciones, los índices considerados para valorar el ajuste de los ítems (Tabla 3), del modelo politómico de Rasch, el targeting y la unidimensionalidad mejoraron, aunque el índice de confiabilidad PSI disminuyó (Tabla 1).
Nota. Se marcaron en negrita aquellos valores que no cumplen con los criterios recomendados para un ajuste adecuado de los ítems. SE = Desviación estándar; χ2 = chi-cuadrado; *=ítems recodificados
Premeditación (falta de)
El análisis inicial de los datos mostro un desajuste en los ítems y en las personas. Además, se obtuvo un χ 2 significativo (Tabla 1). El análisis de las categorías de los ítems no mostró umbrales desordenados y los análisis a nivel de ítems mostraron valores residuales de ± 2.5 para los ítems 4 y 31 y valores χ2 y F significativos (Bonferroni a α ≤ .05) en los ítems 4, 7, 34 y 36 (Tabla 5). El análisis a nivel de persona (N = 800) no mostro casos perdidos, exhibió 9 (1.12%) casos con valores extremos y 20 (2.5 %) casos con valores residuales superiores a ± 2.5. La matriz de correlación residual mostró asociación entre el ítem 19 y 28 (.22). Se encontró que el ítem 4 presentó DIF uniforme, donde las mujeres presentaron puntuaciones más altas que los hombres. El TI y el gráfico de distribución de los umbrales de los ítems y de las personas (Tabla 1) mostraron la concordancia de las personas y los ítems con una distribución muestral de -3,89 a +3,73 logits. Como se muestra en la Tabla 1, esta dimensión presentó un valor aceptable en relación con el supuesto unidimensional.
A partir de estos resultados se eliminó un total de 20 casos con valores residuales atípicos, luego se creó un super-ítem entre los ítems 18 y 19, y se analizó el ajuste del modelo dividiendo el ítem 4 según el sexo de los participantes. Estas estrategias no mejoraron el ajuste del modelo politómico de Rasch. Considerando el elevado valor de ajuste residual del ítem y la curva característica del ítem se eliminaron los ítems 4 y 31. Como resultado de las modificaciones, se obtuvo una versión final con mejores ajustes en los ítems (Tabla suplementaria 4) y en los índices para valorar el ajuste del modelo politómico de Rasch (Tabla 1). No se encontraron umbrales desordenados y tampoco dependencia entre los ítems. El targeting y la unidimensionalidad mejoraron, aunque el índice de confiabilidad PSI disminuyó (Tabla 1).
Nota. Se marcaron en negrita aquellos valores que no cumplen con los criterios recomendados para un ajuste adecuado de los ítems. SE = Desviación estándar; χ2 = chi-cuadrado; *=ítems recodificados
Urgencia positiva
Los análisis iniciales mostraron que esta dimensión poseía un desajuste de los ítems, un ajuste relativamente cercano a lo adecuado de las personas y un χ 2 significativo (Tabla 1). Con respecto a los umbrales de respuesta, estos se mostraron ordenados de acuerdo con el orden ascendente esperado. El análisis a nivel de los ítems mostró que el ítem 5 tenía un valor residual mayor a ± 2.5 y que, a su vez, los ítems 5, 20, 30 y 35 tenían valores χ2 y F significativos (Tabla 6). El análisis a nivel de persona (N = 800) reveló que existían 4 (0.5%) casos perdidos, 9 (1.12%) casos con valores extremos y 23 (2.87%) con valores residuales superiores a ± 2,5. La matriz de correlación residual mostro dependencia entre los ítems 25 y 30 (.26) y no se identificó un DIF uniforme o no uniforme. Con respecto a la confiabilidad, los índice PSI y alfa de Cronbach fueron superiores a .80. En lo que respecta al targeting, el IT (Tabla 1) y el gráfico de distribución de los umbrales de los ítems y de las personas (Figura 5), mostraron que la escala se encontrada centrada en la población objetivo con una distribución muestral de -3,94 a +3,68 logits. Además, la Tabla 1 muestra que esta dimensión presentó un valor aceptable con relación al cumplimiento del supuesto unidimensional.
A partir de estos resultados, se eliminaron 23 casos con valores residuales atípicos y el ítem 5 que presento un ajuste residual inadecuado. Luego de eliminar este ítem se analizó nuevamente el ajuste de los ítems y se encontró que luego de esta modificación el ítem 15 presentaba un ajuste residual inadecuado (3.10), considerando este resultado y la inspección de la CCI se procedió a eliminarlo. Luego de estos cambios, la versión modificada presento mejores valores en los índices del ajuste de los ítems (Tabla 5) y del modelo politómico de Rasch (Tabla 1). No se encontraron umbrales desordenados ni dependencia entre los ítems. Los ítems presentaron valores residuales entre ±2.5 y ningún ítem presento DIF según el sexo. El indicador de unidimensionalidad mejoró, mientras que los índices índice targeting y PSI fueron inferiores a los encontrados en la versión inicial (Tabla 1).
Por último, en la Tabla 7 se puede observar las puntuaciones de las cinco dimensiones de la versión original de la escala UPPPS-P expresadas en puntuaciones brutas (ordinal), en unidades logit y sus puntuaciones transformadas linealmente para calibrar una escala de nivel de intervalo del mismo rango, lo cual permite aumentar la precisión de la evaluación de las dimensiones que mide la escala.
Nota. Se marcaron en negrita aquellos valores que no cumplen con los criterios recomendados para un ajuste adecuado de los ítems. SE = Desviación estandar; χ2 = chi-cuadrado; *=ítems recodificados
Discusión
El propósito del presente estudio de investigación fue examinar las propiedades psicométricas de la escala de impulsividad UPPS-P en una muestra de adolescentes argentinos. Para cumplir con este objetivo se utilizó el modelo de parametrización de crédito parcial, basado en el modelo de Rasch. La UPPS-P ha sido construida y validada bajo los postulados de la TCT, lo que podría generar que al someter este instrumento a un análisis basado en el modelo politómico de Rasch puedan surgir índices que no presentan un ajuste óptimo. Para obtener el cumplimiento de los supuestos de la TRI, se realizaron modificaciones a la escala original para lograr un ajuste adecuado al modelo y ofrecer la posibilidad de generar un instrumento de medida alternativo sin perder precisión de medida (Esakki et al., 2018).
En el análisis de las categorías de respuesta de la UPPS-P se observó que 34 de los 40 ítems presentaron categorías de respuesta ordenadas, es decir demuestran un nivel creciente del rasgo latente de la escala. No obstante, un ítem de la subescala urgencia negativa y cinco ítems de la subescala de búsqueda de sensaciones presentaron desorden en las categorías de respuestas intermedias (“poco parecido a mí”, “parecido a mí”). Este resultado concuerda con otro estudio que sometió la UPSS-P en adultos al modelo politómico de Rasch en una muestra portuguesa (Leandro, 2015). Cabe mencionar, que los análisis realizados desde la TCT no nos brindan información respecto al funcionamiento de la escala de respuesta tipo Likert, por lo cual el análisis de las categorías de respuesta nos ofrece información valiosa para profundizar los análisis de la escala y proponer otras alternativas con un mayor o menor número de categorías de respuesta que mejoren el ajuste al modelo (Chachamovich et al., 2009).
Avanzando en el punto anterior es necesario identificar, registrar y encontrar la causa del desorden de las categorías de respuesta, este comportamiento puede responder a ambigüedades en el contenido o que la intención de la opción de respuesta no esté lo suficientemente clara como para que el adolescente distinga la posición del rasgo que demuestra (Zhu, & Chuntian, 2017). Si este comportamiento no puede justificarse o resolverse deberían eliminarse estos ítems (Andrich, 2010). En el presente estudio se colapsaron las categorías intermedias de los seis ítems, de modo que en la versión alternativa estos ítems se presentan con tres categorías de respuesta. Este proceso de reordenamiento de categorías ofreció un mejor ajuste y funcionamiento de la escala de respuesta de estos ítems.
El supuesto de unidimensionalidad se confirmó en cada subescala de la versión original y alternativa de la UPPS-P, indicando que cada factor evalúa un único aspecto del constructo de impulsividad, acorde a la estructura teórica bajo la cual fue construida este instrumento (Gunn & Smith, 2010; Zapolski, et.al, 2010). Respecto al supuesto de independencia local, dicho supuesto se cumplió en las subescalas de urgencia negativa y búsqueda de Sensaciones, en cambio se observó dependencia entre dos pares de ítems (3-18 y 23-27) de la subescala (falta de) perseverancia, un par de ítems (19 y 28) de (falta de) premeditación y en urgencia positiva (ítem 25 y 30). El origen de estas correlaciones mayores a .20 podría deberse a que los ítems involucrados presentaron una redacción que utilizan frases compuestas por acciones similares que generaron ítems redundantes en su contenido. Por ejemplo, el ítem 25 “Cuando estoy muy contento/a me descontrolo” y el ítem 30 “Me descontrolo cuando estoy de muy buen humor”. Cabe remarcar que luego de las modificaciones introducidas en la versión alternativa se comprobó el supuesto de independencia local en todas las dimensiones de la UPPS-P.
Los índices de consistencia interna, calculados a partir del alfa de Cronbach y el índice de separación persona (PSI), fueron desde aceptables a buenos en las cinco subescalas de la versión original mientras que en la versión alternativa la dimensión búsqueda de sensaciones fue la única que no alcanzó los valores recomendados para el PSI. Estos resultados indican que la UPPS-P es una medida lo suficientemente precisa para distinguir grupos de adolescentes con distintos niveles del constructo evaluado. Resultados similares se encontraron en la versión de 40 ítems del estudio realizado por Caneto et al. (2020) y Tomko et al. (2016). En ambas versiones, la UPPS-P-C demostró que existe correspondencia en el posicionamiento de la muestra respecto a los niveles de rasgo que mide cada uno de los ítems. Esta comparación nos aporta información de la validez de la escala y los distintos niveles de rasgo que permite medir la escala, indicando que la UPPS-P-C presenta un targeting entre adecuado y aceptable en todas las subescalas. A nivel general, en el presente estudio se observó que los participantes se ubicaron levemente hacia los valores negativos mientras que los ítems se localizaron en la zona central del grafico lo que indicó un mejor posicionamiento para los niveles de impulsividad medios a bajos, a excepción de la subescala de búsqueda de sensaciones donde las personas se ubicaron levemente hacia los niveles positivos del gráfico.
Algunos ítems de las subescalas de la UPPS-P-C, a excepción de la dimensión urgencia positiva, presentaron un funcionamiento diferencial del ítem respecto al sexo. A nivel general, este resultado coincide con estudios previos que han confirmado la invarianza de medida de la UPPS-P-C respecto al sexo (Caneto et al., 2020). Sin embargo, la detección de funcionamiento diferencial de los ítems, en la subescala urgencia positiva, puede deberse a la precisión de los métodos estadísticos utilizados desde la TRI para evaluarlo (Meade & Lautenschlager, 2004). Por último, en el presente estudio se presenta los puntajes transformados a una escala intervalar de las cinco dimensiones que componen la UPPS-P. Esta transformación de las puntuaciones permite incrementar la exactitud en la medición, ya que las estimaciones del factor latente de manera intervalar les permite a los investigadores obtener mayor precisión en la valoración del constructo impulsividad (Granberg-Rademacker, 2010; Harwell & Gatti, 2001). Además, colabora con aquellos estudios de investigación que precisen utilizar métodos analíticos paramétricos.
Entre las limitaciones del presente estudio se encuentran que si bien la muestra resulta suficiente para obtener conclusiones válidas, su composición evidencia disparidad con un mayor porcentaje de participantes del sexo femenino. Además, aunque este estudio aporta evidencia empírica que sustenta la utilización de la escala UPPS-P-C para valorar la impulsividad de manera multidimensional en adolescentes, se recomienda que futuros estudios evalúen las propiedades psicométricas de la escala en muestras de adolescentes con mayor heterogeneidad (e.g., adolescentes institucionalizados). Sin embargo, a pesar de estas limitaciones, la aplicación del modelo politómico de Rasch a la UPPS-P para adolescentes, aporta evidencia psicométrica del ajuste del modelo, del funcionamiento de los ítems, de las categorías de respuesta y del DIF, aspectos que complementan los análisis realizados desde la TCT. Además, se construyó una tabla de conversión con los puntajes brutos de la versión original de la escala y los valores equivalentes en una escala logit e intervalar para aquellos estudios de investigación que lo precisen. Asimismo, como resultado de los análisis psicométricos realizados desde la TRI se obtuvo una versión alternativa de la UPPS-P-C para que futuros estudios continúen evaluando la composición interna de la escala o utilicen en sus investigaciones aquellos ítem que presentaron mejor ajuste en el presente estudio.