INTRODUCCIÓN
La investigación científica es un motor de desarrollo económico y social en el mundo 1. Por ello, impulsar la producción científica desde el pregrado es vital en países como Perú, donde la proporción de productos científicos que llegan a publicarse en revistas científicas es muy baja 2. Este hecho puede explicarse debido a que los asesores y jurados de tesis tienen poca experiencia elaborando y publicando manuscritos científicos, esta situación ha sido encontrada en el contexto peruano 3-5.
Frente a esta realidad, es importante estudiar las capacidades de los jurados o dictaminadores de tesis de grado, quienes representan a un selecto grupo de expertos profesionales en determinada especialidad, que, además, tienen el desafío y la responsabilidad de evaluar la calidad y el potencial publicable de los trabajos de investigación 6. No obstante, en países donde la formación de recursos humanos en investigación científica no es la esperada 7, es poco probable encontrar jurados con seguridad y confianza para generar producción científica. Por ello, estos suelen basar sus revisiones en aspectos básicos y formales de la tesis, dejando de lado aspectos vitales como la calidad metodológica o el potencial publicable de los resultados de investigación 8.
En este escenario, una de las capacidades que se requiere en la evaluación de trabajos de investigación es la auto-eficacia profesional, variable que implica tener confianza 9) en las capacidades propias para afrontar con eficiencia tareas, obligaciones y desafíos relacionados con la actividad profesional 10. La autoeficacia influye directamente sobre los resultados académicos esperados 11. Algunas investigaciones dan cuenta que en docentes universitarios la autoeficacia para la enseñanza suele ser mayor que la autoeficacia para investigar 12. En contextos donde hay gran proporción de profesores con autoeficacia alta, se ha reportado un impacto positivo sobre el desempeño y valor del aprendizaje de las ciencias 13.
Dada la importancia del tema, en la literatura disponible existen medidas para evaluar la autoeficacia profesional en docentes universitarios, instrumentos que cuentan con evidencias de validez y confiabilidad probadas en algunos países del contexto latinoamericano 14, incluido el Perú 15. Sin embargo, aún no se cuenta con adaptaciones o versiones que evalúen específicamente el sentido de eficiencia para evaluar las tesis de grado. Esta situación limita la investigación de las capacidades investigativas del grupo de profesionales dedicados a evaluar trabajos de grado en ciencias de la salud.
Frente a este vacío en la literatura científica, el presente estudio tiene como objetivo diseñar y validar una escala de autoeficacia de jurados dictaminadores de ciencias de la salud en la evaluación de las tesis de grado.
MÉTODOS
Diseño del estudio
Se realizó un estudio transversal de tipo instrumental 16. La recogida de datos fue realizada entre los meses de noviembre y diciembre del 2021.
Población y muestra
La población identificada para el estudio fueron 545 docentes universitarios que asumieron la responsabilidad de ser jurados de tesis en tres universidades privadas de Perú, durante el 2021. Por razones de accesibilidad, se aplicó un muestreo no probabilístico por conveniencia.
Instrumento
Se diseñó el instrumento en 5 etapas. Primero, se buscó indicadores teóricos relacionados al constructo autoeficacia profesional en el contexto de la evaluación de tesis de grado o trabajos de investigación en publicaciones realizadas entre 2011 y 2021 en Scielo y Scopus 6,11,12,15. Se emplearon términos de búsqueda como "Autoeficacia en jurados de tesis", "Autoeficacia en jurados de trabajos de grado", "Autoeficacia en evaluadores de tesis", "Autoeficacia en evaluadores de trabajos de grado" y "Autoeficacia para la investigación". En Scielo se empleó una estrategia que incluyó términos booleanos en el motor de búsqueda de Google, se consideró las librerías para Argentina, Chile, Brasil, Colombia, Cuba, España, Costa Rica, México, Paraguay, Portugal, Perú, Uruguay y Venezuela; además de SciELO Salud Pública y SciELO Ciencias Sociales. Ejemplo: "Autoeficacia en asesores de tesis": https://www.scielo.cl/ o sitio: http://www.scielo.org.pe/ ...
En Scopus se aplicó una búsqueda avanzada con operadores booleanos. Ejemplo: "Autoeficacia" y su relación con los términos: "Autoeficacia en jurados de tesis" OR "Autoeficacia en evaluadores de tesis" OR "Autoeficacia en jurados de trabajos de grado" OR "Autoeficacia en evaluadores de trabajos de grado", OR "Autoeficacia para la investigación", en los campos de título, resumen y palabras clave.
Segundo, producto de la revisión bibliográfica se hallaron aspectos teóricos para la comprensión del constructo auto-eficacia en la evaluación de trabajos de grado. Por ejemplo, la importancia de ser competente para evaluar y revisar trabajos de investigación (6, es decir, que el jurado dictaminador demuestre dominio del método científico en el ejercicio de la investigación científica, lo cual puede evidenciarse a través de su producción científica vigente. Aunado a esto, la importancia de tener condiciones personales para hacer más eficiente el proceso de mejorar la calidad de los productos científicos, dado que evaluar trabajos de grado no solo se trata de emitir juicios de sentencia, sino, más bien motivar el espíritu de la indagación en los tesistas 11,12. Finalmente, el cumplimiento de roles, definido como asumir con responsabilidad y compromiso la función de dictaminador, que además de dar observaciones, implica ser más servicial, puntual, amable y comprometido. Estas cualidades podrían generar mejores resultados a la hora de elaborar propuestas de investigación con potencial publicable (13,15.
En función de estos componentes teóricos, se definió conceptualmente el constructo como "la autopercepción acerca de la confianza que tiene un jurado dictaminador respecto a sus competencias, condiciones personales y cumplimiento de roles para evaluar con eficiencia las tesis de grado". Se operacionalizó la variable en 16 indicadores: experiencia en el tema que evalúa (ítem 1), dominio de la metodología de la investigación (ítem 2), producción científica (ítem 3), experticia en línea de investigación (ítem 4), manejo de información científica (ítem 5), respeto (ítem 6), prudencia (ítem 7), honestidad (ítem 8), apertura (ítem 9), autocrítica (ítem 10), conocimiento del reglamento de investigación (ítem 11), capacidad de conciliación (ítem 12), actitud de apoyo (ítem 13), responsabilidad ítem 14), puntualidad (ítem 15) y servicio (ítem 16).
Tercero, para cada indicador se propuso un reactivo en sentido afirmativo, planteando opciones de respuesta en formato Likert: muy en desacuerdo, en desacuerdo, ni de acuerdo ni en desacuerdo, de acuerdo y muy de acuerdo. En cuarto lugar, se sometió la primera versión de la escala (16 ítems) a evaluación por juicio de 10 expertos (docentes de investigación, jurados de tesis e investigadores certificados por el CONCYTEC), quienes calificaron la relevancia, la representatividad y la claridad de los ítems.
Finalmente, se aplicó una prueba piloto mediante un grupo focal, el mismo reunió a 15 jurados de tesis con características similares a las de la población de estudio. En este proceso se aplicó una entrevista grupal bajo las directrices de un cuestionario previamente elaborado. En la interacción se buscó opinión acerca de la relevancia del instrumento, la detección de errores semánticos o gramaticales, el grado de comprensibilidad de los ítems y posibles incongruencias respecto a la medición del constructo. La reunión duró 45 minutos y no hubo observaciones de los participantes. Luego de esta etapa se obtuvo la versión inicial de la escala.
Análisis de datos
Para analizar la validez basada en el contenido se recurrió al coeficiente V de Aiken y sus intervalos de confianza del 95% (IC 95%). En este caso, una V ≥ 0,70 y un límite inferior del intervalo de confianza ≥ 0,59 indicaron una valoración positiva del reactivo. Antes de analizar la validez de constructo, se realizó un análisis descriptivo para explorar datos como la media, desviación estándar, asimetría y curtosis. Luego se exploró la estructura interna aplicando un análisis factorial exploratorio (AFE), utilizando la técnica de mínimos cuadrados no ponderados con rotación promin oblicua. Para el diagnóstico de bondad de ajuste se estimaron los índices de ajuste comparativo (CFI, por sus siglas en inglés), índice de Tucker-Lewis (TLI, por sus siglas en inglés), índice de bondad de ajuste (GFI, por sus siglas en inglés) e índice de bondad de ajuste ajustado (AGFI, por sus siglas en inglés). Un ajuste satisfactorio fue definido por un CFI ≥ 0,95, TLI ≥ 0,95, GFI ≥ 0,95, AGFI ≥ 0,95 y RMSEA ≥ 0,08 17.
Por último, se calculó la confiabilidad con el coeficiente alfa de Cronbach y sus respectivos IC95%. Para el análisis descriptivo y la confiabilidad se utilizó el programa estadístico SPSS versión 25,0 y para el AFE el programa FACTOR Analysis versión 10,1.
RESULTADOS
Descripción de la muestra
Participaron 221 jurados (65,21% varones), de entre 25 a 65 años (media = 37,56; desviación estándar = 10,16), adscritos a carreras como medicina (21,26%), odontología (19,45%), psicología (20,81%), nutrición (15,38%) y enfermería (11,31%). El 43,75% labora en la sierra peruana, el 34,93% en la costa y el 21,32 en la selva.
Validez basada en el contenido
Todos los ítems de la primera versión de la escala obtuvieron una evaluación favorable. En tal sentido, ponderando el criterio de los jueces, los ítems 1,5,7,13 y 14 alcanzaron mayor relevancia (V = 0,93; IC95%: 0,82 - 0,98), los ítems 1,2 y 7 se presentan como más representativos, y los ítems 1,12 y 14 como los más claros (Tabla 1).
Análisis preliminar de los ítems
El ítem 16 tuvo el mayor puntaje promedio (media = 4,45). Respecto a la variabilidad, el ítem 3 (desviación estándar = 1,09) tuvo la mayor dispersión. Todos los ítems, a excepción de los ítems 1,2,3 tienen valores de asimetría y curtosis que superan el valor ± 1,5 (17). El ítem 11 tiene un valor de asimetría menor de 1,5. Por otro lado, se identificó que el ítem 3 "Me considero lo suficientemente capacitado para publicar artículos científicos", el ítem 8 "Ante todo, soy honesto para aprobar o desaprobar una tesis" y el ítem 12 "Tengo la convicción de que puedo llegar a acuerdos con el resto de jurados" fueron eliminados por presentar una varianza común inferior a 0,30 (Tabla 2).
Análisis factorial exploratorio
Respecto a la adecuación muestral para el análisis factorial se encontró que la medida de Kaiser-Meyer-Olkin (KMO = 0,868) y la prueba de Bartlett (Chi-cuadrado = 2302,1; gl = 66; p < 0,01) fueron adecuados. Con el método de mínimos cuadrados no ponderados se obtuvo un modelo unidimensional (los 13 ítems saturaron en un solo factor). El factor explicó el 60,99% de la varianza total de la escala y sus cargas factoriales oscilaron entre 0,605 y 0,872 (Tabla 3). Los análisis robustos (Chi-cuadrado = 116,878; p < 0,01; TLI = 0,971; CFI = 0,976; GFI = 0,981; AGFI = 0,977) muestran que la estructura unidimensional es satisfactoria. Respecto a la consistencia interna, el coeficiente alfa de Cronbach fue de 0,943 (IC95% = 0,92 - 0,95).
DISCUSIÓN
Los trabajos de investigación a nivel de pregrado requieren de la evaluación de un jurado dictaminador experto en determinado campo científico 6, no obstante, muy pocos jurados tienen las competencias para tal fin 4, hecho que pone en duda su autoeficacia en la evaluación de tesis de grado 18. Los resultados del estudio revelaron los buenos atributos psicométricos de una escala que mide con 13 ítems en un solo factor la autoeficacia para evaluar tesis de grado (EAE-Te).
Los análisis por parte del juicio de expertos muestran en todos los ítems una valoración positiva de los ítems 19. La consistencia interna de los ítems y de los dominios medida por el alfa de Cronbach fue mayor a 0,80, que de acuerdo con Hill y Hill 20) se consideran aceptables. Por otra parte, el AFE sugirió que la estructura unidimensional es satisfactoria, siendo este hallazgo similar al estudio de Saez-Delgado et al. 21) y Navarro-Loli y Dominguez-Lara 22, donde se observa evidencia que apunta a una estructura factorial unidimensional 23. Este hallazgo también ha sido encontrado en un estudio realizado en Perú 15. Sin embargo, algunos autores consideran este constructo como multidimensional, por ejemplo, Gonzales 24) reportó un modelo de 6 factores y Alotaibi 25) lo reportó como un constructo multidimensional.
En específico, el ítem 7 es el que tiene mayor carga factorial, y explica mejor la autoeficacia para la evaluación de trabajos de grado. Este resultado es entendible, conociendo que la mayoría de los estudiantes esperan comprensión y palabras prudentes de parte de los jurados 6. Según Moreno y Ochoa se necesita destacar el papel dialógico pues guía a la discusión y aclaración 26. Un hecho que ha sido reseñado también durante la elaboración de la tesis universitaria 27) o como fracaso o retraso en su finalización 28.
Este estudio pone a disposición un instrumento válido y fiable para ser utilizado en la medición de la autoeficacia para la evaluación de tesis de grado en jurados dictaminadores de tesis. Por lo tanto, representa un aporte a la literatura científica debido a que no se han encontrado instrumentos que midan esta variable. Por otro lado, a medida que las metodologías y la información avanza, el instrumento EAE-Te puede usarse para resaltar áreas específicas de mejora necesaria en programas de capacitación de dictaminadores de tesis. Se recomienda capacitar en habilidades de comunicación, porque esto es considerado muy importante por los universitarios 29. Areepattamannil et al. 30, afirmaron que tanto estos cursos como las experiencias, permiten no sólo a los dictaminadores sino también a los docentes adquirir conocimiento e implementar un modelo de instrucción eficaz.
El estudio presenta algunas limitaciones. Primero, la aplicación de un muestreo no probabilístico limita la generalización de los resultados. Esto claramente tiene repercusiones sobre la validez externa de la escala EAE-Te, pues no es posible asegurar que los hallazgos encontrados pueden aplicarse a otros individuos con características similares a las del estudio o de escenarios similares como los jurados de facultades de humanidades, ingenierías, empresariales, entre otros. Sería necesario futuras investigaciones en muestras probabilísticas para ampliar las evidencias psicométricas de la escala EAE-Te en población de jurados dictaminadores del resto de facultades de ciencias de la salud y de otras áreas de conocimiento. Segundo, la escala EAE-Te se encuentra en fase experimental, no se realizó un análisis factorial confirmatorio, lo cual requiere una muestra más amplia 17. Además, al ser un estudio voluntario es probable que algunos participantes tuvieran la necesidad de referir sus propias experiencias sesgando de alguna manera los resultados. Tercero, la escala presentada también requiere de mayor análisis con respecto a su validez concurrente, convergente y predictiva en el contexto universitario peruano.
A pesar de estas limitaciones, es importante destacar la utilidad de los resultados de la EAE-Te debido a la especificidad del constructo (autoeficacia profesional en el contexto de la evaluación de tesis de grado) y número de ítems (trece). Por ello, se concluye que la escala EAE-Te presenta evidencias psicométricas iniciales de validez basada en el contenido, estructura interna y fiabilidad para medir la autoeficacia para la evaluación de tesis de grado en jurados de ciencias de la salud.