INTRODUCCIÓN
Según la Organización Mundial de la Salud (OMS) 1, se estima que, a nivel global, el 5 % de los adultos padecen de depresión, constituyendo una causa importante de discapacidad. En el Perú, la prevalencia de vida de trastornos depresivos en el año 2012 fue de 17,3 % en Lima Metropolitana y Callao 2. Actualmente, estudios realizados en dicho país evidencian que la pandemia de la COVID-19 tuvo un impacto significativo en la salud mental de la población, acentuando más los problemas de depresión 3.
Existen diversas escalas que se utilizan ampliamente como herramientas de screening de depresión con fines clínicos o de investigación; algunas son el Inventario de Depresión de Beck (BDI) 4, la Escala de Autoevaluación para la Depresión de Zung (ZSDS) 5, el Cuestionario de Salud del Paciente de 9 ítems (PHQ-9) 6 y la Escala de Depresión del Centro de Estudios Epidemiológicos (CES-D) (7). Estas herramientas de medición se administran mediante lápiz y papel; sin embargo, al utilizarlas mediante un formato de aplicación en línea, varias de estas escalas muestran evidencias adecuadas de confiabilidad y validez 8. Incluso, algunos participantes han mostrado una predilección por el uso de escalas en formato virtual en comparación a la administración presencial 9.
Por otro lado, considerando que los instrumentos extensos podrían generar un sesgo al afectar la forma de responder del individuo y su disposición a participar o terminar de desarrollar la prueba 10-12, el uso de escalas abreviadas podría significar una ventaja. Se han desarrollado versiones cortas de escalas de depresión tales como la CES-D (13, 14), el Cuestionario de Yesavage (GDS) 15 y la Escala de Psicopatología Depresiva (EPD-4) 16; sin embargo, su validez no ha sido evaluada en línea.
La EPD-4 ha mostrado evidencias adecuadas de validez de manera presencial en el Perú 16, y su número reducido de ítems (n = 4) podría significar una ventaja frente a los 21 del BDI 4, los 20 de la CES-D 7 o la ZSDS 5 y los 9 del PHQ-9 6.
La escala CES-D, que se usará como patrón de referencia en este estudio, cuenta con 20 ítems que evalúan los síntomas experimentados por el paciente en la última semana 7. Ha mostrado adecuadas evidencias de validez en el Perú, siendo un instrumento útil para tamizar la depresión en entornos clínicos y en la investigación epidemiológica 17. Una revisión sistemática realizada por Van Ballegooijen et al. 18 indica que la CES-D es la herramienta en línea mejor estudiada para evaluar la depresión en la población general, mostrando propiedades psicométricas adecuadas entre las muestras reclutadas. Adicionalmente, diversos estudios han respaldado la validez y confiabilidad de esta escala en línea, haciendo de este instrumento virtual, una alternativa prometedora al cuestionario presencial en papel (19, 20).
El contexto de la pandemia por la COVID-19, así como las medidas restrictivas de aislamiento social, dificultaron la ejecución de estudios presenciales, por lo que la realización de encuestas virtuales representó una buena alternativa en dicha situación. De esta forma, si bien ya se han llevado a cabo estudios sobre depresión a través de encuestas virtuales (21, 22), aún resulta necesario obtener más información sobre las propiedades psicométricas de dichos instrumentos en este formato; y en especial de escalas breves.
Por este motivo, consideramos que es de suma importancia recolectar evidencia de validez de una escala de depresión administrable de manera virtual, que sea corta, rápida, fácil de llenar y con buena eficacia diagnóstica.
El objetivo del presente estudio es obtener evidencia de validez en la población adulta del Perú de la versión en línea de la EPD-4, tomando como patrón de referencia la CES-D.
MATERIALES Y MÉTODOS
Participantes
Se realizó un muestreo por conveniencia y de tipo «bola de nieve». Se prefirió este método debido a que era compatible con la captación de los participantes a través de redes sociales y su evaluación en línea, lo cual era necesario debido a las restricciones de la pandemia por la COVID-19. Aunque esto implicaba un alto riesgo de afectar la representatividad de la muestra y, por consiguiente, una estimación de la prevalencia de depresión poco confiable, este inconveniente no tendría una influencia importante para los fines de la validación del instrumento. Considerando que el instrumento debía tener una sensibilidad y especificidad aproximadas de 80 %, con un margen de error de 10 % y un nivel de confianza de 95 %, se obtuvo un mínimo de 62 participantes con depresión y 62 sin depresión. Se incluyeron adultos de ambos sexos mayores de 18 años residentes en Perú con acceso a Internet.
Instrumentos y variables
La información recogida por la encuesta administrada en línea incluyó los siguientes datos: sexo, edad, estado civil, grado de instrucción, ocupación, lugar de residencia, antecedentes de depresión, trastornos de ansiedad y otras patologías psiquiátricas, diagnóstico de COVID-19, antecedente familiar de COVID-19, puntaje de depresión según la CES-D y de acuerdo con la EPD-4.
La EPD-4 evalúa la sintomatología depresiva en base a 4 preguntas referidas a lo experimentado por el paciente en las últimas 2 semanas. Cada ítem tiene 4 alternativas que pueden calificarse de 0 a 3, con una variación del puntaje total de la escala entre 0 y 12. El primer ítem evalúa el cansancio; el segundo, la reactividad del ánimo; el tercero, la anhedonia; y el cuarto, la tristeza. Esta escala fue validada en Perú, y considerando el punto de corte de 6, su sensibilidad fue de 82,8 % y su especificidad de 79,8 %, respecto al diagnóstico de depresión mayor de acuerdo con la entrevista clínica estructurada para el DSM-IV 16. La EPD completa o sus versiones cortas han sido utilizadas en otros estudios. Por ejemplo, en una investigación sobre la estructura de los síntomas anímicos y ansiosos, se encontró que los ítems de la EPD-4 son elementos importantes de la estructura sintomatológica de la depresión 23. Asimismo, se ha hallado que el ítem de tristeza de la EPD-4 es uno de los más relevantes para la evaluación de la severidad de los trastornos mentales en pacientes sin psicosis ni déficit cognitivo 24. Adicionalmente, la EPD se ha usado para evaluar la depresión en pacientes con diabetes 25.
La CES-D evalúa la depresión en base a 20 preguntas que hacen referencia a los síntomas del paciente en la última semana. Cada ítem tiene 4 alternativas que pueden calificarse de 0 a 3, con lo que el puntaje total de la escala puede variar entre 0 y 60. Este instrumento es la herramienta en línea mejor estudiada para evaluar la patología depresiva en la población general 18 y diversos estudios respaldan la validez y confiabilidad de su versión en línea (19, 20). En la presente investigación, la CES-D se tomó como patrón de referencia o criterio de clasificación para determinar si el encuestado presentaba o no depresión, definiéndose esta con un puntaje de 24 o más. Este punto de corte fue establecido en un estudio realizado en el Perú, encontrándose que tiene una sensibilidad de 91,4 % y una especificidad de 96,7 % para el diagnóstico de depresión mayor 17.
Procedimiento
A través de distintos medios digitales (Instagram, Facebook, WhatsApp y Telegram) se envió un mensaje a los contactos cercanos de los investigadores (familiares y amigos) solicitándoles lo siguiente: llenar la encuesta en línea a través de un enlace hacia la plataforma Google Forms y reenviar dicho mensaje a sus conocidos mediante sus redes sociales (muestreo de bola de nieve). Previo al llenado de la encuesta, los participantes autorizaron su participación a través de un consentimiento informado.
La primera parte de la encuesta recogió datos concernientes a las características sociodemográficas y antecedentes del participante. Posteriormente, se le pidió al encuestado que responda la EPD-4 y la CES-D.
Cabe destacar que las encuestas fueron administradas entre agosto del 2021 y abril del 2022, durante el contexto de la pandemia global por la COVID-19.
Descripción de la muestra
Para las variables categóricas, se especificó la frecuencia y el porcentaje respectivo. Para las variables numéricas, se calculó la media, desviación estándar, mediana, percentil 25 y 75.
Relación entre la EPD-4 y la CES-D
Tomando como criterio de clasificación la presencia de la depresión en base a la CES-D (puntaje mayor o igual a 24), se calculó la especificidad, sensibilidad e índice de Youden para cada uno de los puntos de corte de la EPD-4. Se escogió como punto de corte óptimo (puntaje que determina la presencia de patología depresiva) al que tenía el índice de Youden máximo. Asimismo, se determinó la correspondiente área bajo la curva de ROC (abcROC). Adicionalmente, se realizó una regresión lineal heterocedástica con el objetivo de establecer una relación entre los puntajes de la EPD-4 y la CES-D.
Consistencia interna y validez de constructo de la EPD-4
Para el análisis de la consistencia interna, se calculó el coeficiente omega de McDonald, el alfa de Cronbach y los coeficientes de correlación ítem-resto de la escala. Para evaluar la validez de constructo, se realizó el análisis factorial exploratorio de la matriz policórica de los ítems de la escala EPD-4 mediante una rotación ortogonal de varimax. Utilizando un análisis factorial confirmatorio con el estimador weighted least squares means and variance adjusted (WLSMV), se verificó la unidimensionalidad de la escala mediante los siguientes índices de ajuste para un modelo unifactorial: root mean square error of approximation (RMSEA), comparative fit index (CFI), Tucker-Lewis index (TLI) y standardized root mean square residual (SRMR). Finalmente, se evaluó la EPD-4 mediante la metodología de la teoría de respuesta al ítem (IRT), determinándose, mediante el modelo de respuesta graduada, los valores de discriminación de cada uno de sus ítems, así como los de dificultad para cada uno de los puntajes de cada ítem.
Aspectos éticos
El presente trabajo de investigación fue aprobado por el Comité Institucional de Ética de la Universidad Peruana Cayetano Heredia (UPCH). Previo a la encuesta, cada participante del estudio debió aceptar un consentimiento informado para poder proseguir. La información brindada por el encuestado fue completamente anónima y los datos obtenidos fueron codificados y almacenados en archivos electrónicos con contraseñas conocidas solo por los investigadores. La confidencialidad fue respetada en todo momento. Una vez que el paciente finalizó el llenado de la encuesta, se le brindó un folleto sobre orientación a personas con síntomas relacionados con depresión.
RESULTADOS
Descripción de la muestra
Un total de 256 personas participaron respondiendo la encuesta enviada en línea. La tabla 1 describe las variables cualitativas de la muestra, las cuales corresponden a las características sociodemográficas y antecedentes de los participantes. La tabla 2 describe las variables numéricas (edad, puntaje de la EPD-4 y de la CES-D).
Tabla 2 Descripción de la muestra (variables numéricas).

EPD-4: Escala de Psicopatología Depresiva de 4 ítems; CES-D: Escala de Depresión del Centro de Estudios Epidemiológicos; p: percentil.
De los 256 participantes, 73 (28,52 %) tenían depresión en base a la CES-D (puntaje mayor o igual a 24), mientras que los 183 (71,48 %) restantes dieron negativo para depresión.
Relación entre la EPD-4 y la CES-D
La tabla 3 muestra la sensibilidad, especificidad e índice de Youden para los distintos puntos de corte de la EPD-4, utilizando como criterio de clasificación la presencia de depresión en base a la CES-D. En este caso, podemos apreciar que el punto de corte óptimo de la EPD-4 para considerar que el participante tiene depresión es 4 (que corresponde al índice de Youden máximo). La correspondiente abcROC fue de 0,9243 (IC 95 %: 0,8899-0,9587).
Tabla 3 Sensibilidad, especificidad e índice de Youden de los puntos de corte de la escala EPD-4.

EPD-4: Escala de Psicopatología Depresiva de 4 ítems; LR: likelihood ratio (razón de verosimilitud).
En la regresión lineal que relaciona los puntajes de la EPD-4 (variable independiente) con los de la CES-D, se obtuvo un coeficiente de 4,39 (IC 95 %: 4,03-4,74; p < 0,001) y una constante de 3,13 (IC 95 %: 1,77-4,49; p < 0,001) (figura 1). El coeficiente de correlación de Spearman entre ambas escalas fue 0,8255 (p < 0,001).
Consistencia interna y validez del constructo de la EPD-4
En relación con la consistencia interna, el coeficiente omega de McDonald fue 0,8229; mientras que el alfa de Cronbach, 0,8126. La tabla 4 muestra el análisis de la consistencia interna de la EPD-4, indicándose los coeficientes de correlación de cada ítem con el resto de la escala, así como el alfa de Cronbach que se obtiene al excluir cada uno de sus 4 ítems. El mayor coeficiente de correlación (0,7182) lo tiene el tercer ítem de la escala (que evalúa anhedonia). De igual manera, la mayor caída del alfa de Cronbach (hasta 0,7226) se da cuando se retira el tercer ítem (anhedonia).
Tabla 4 Consistencia interna de la Escala de Psicopatología Depresiva de 4 ítems y las cargas factoriales de sus ítems en un modelo unifactorial.

EPD-4: Escala de Psicopatología Depresiva de 4 ítems; * Carga factorial en análisis factorial exploratorio policórico.
El análisis factorial exploratorio de los ítems de la EPD-4 indica que la escala es unifactorial: el eigenvalue del factor 1 es 2,64, mientras que el de los siguientes factores son valores negativos. En la tabla 4 podemos apreciar las cargas factoriales de los ítems de la EPD-4, siendo todas ellas altas (>0,7). El tercer ítem (anhedonia) tiene la carga factorial más elevada (0,8897), es decir, es el ítem que tiene mayor relación con el constructo «depresión». Finalmente, los resultados del AFC para la EPD-4 presentaron índices de ajuste adecuados del modelo unifactorial, los cuales fueron los siguientes: RMSEA = 0,055 (IC 90 %: 0,000-0,148); CFI = 0,999; TLI = 0,996; y SRMR=0,019.
La tabla 5 muestra los resultados del análisis de teoría de respuesta al ítem: los valores de discriminación de cada uno de los ítems de la escala EPD-4; así como los valores de dificultad para cada uno de los puntajes de cada ítem. El ítem con mayor valor de discriminación es la anhedonia (4,21; IC 95 %: 2,46-5,96), por lo que se considera que es el ítem con mayor contribución para medir depresión (consistente con el mayor coeficiente de correlación y mayor caída del alfa de Cronbach si se retira). Los valores de dificultad de cada puntaje indican qué tanto nivel de depresión (variable latente) se necesita para lograr dicho puntaje, resultando el ítem de reactividad del ánimo el que tiene mayor grado de dificultad en general.
DISCUSIÓN
Nuestros resultados sugieren que la EPD-4 en línea es una herramienta útil para la detección de patología depresiva. El abcROC encontrada de 0,9243 tiende a ser superior a la de otras escalas de depresión aplicadas a lápiz y papel validadas en el Perú, tales como la EPD-4 (0,90) (16), la EPD-6 (0,87) 16, la EPD-20 (0,87) 26, la CES-D (0,83) 17 y la ZSDS (0,84) 17; y en otros países de habla hispana, tales como una versión abreviada de la Escala de Zung para Depresión (0,86) en Colombia 27 una versión de 10 ítems de la CES-D en adolescentes (0,86) en Colombia 13, una versión corta de la DASS (Escalas de Depresión, Ansiedad y Estrés) (0,90) en Chile 28 y una versión corta del cuestionario de Yesavage (GDS) para adultos mayores de 65 años (0,84) en España 15.
El punto de corte óptimo obtenido para la escala EPD-4 validada en línea fue de 4, con un índice de Youden de 0,7 (sensibilidad de 82,19 % y especificidad de 87,43 %), en contraste con la EPD-4 validada presencialmente 16, donde se encontró un punto de corte de 6 con un índice de Youden de 0,63 (sensibilidad de 82,8 % y especificidad de 79,84 %). Esta discrepancia podría explicarse por el hecho de que la validación en línea se hizo con individuos captados de la población general; y la presencial, con pacientes de consultorios externos de psiquiatría, los cuales se espera que tengan mayores niveles de depresión. Efectivamente, los puntajes promedio de la EPD-4 del estudio en línea fueron menores a los del estudio presencial: 2,91 versus 5,48 16. Asimismo, en ambos trabajos se han empleado distintos patrones de referencia para el diagnóstico de depresión (CES-D y Entrevista Clínica Estructurada para el DSM-IV, respectivamente) 16.
El índice de Youden para la EPD-4 del presente estudio se puede considerar bueno en relación con los de diversos instrumentos que detectan patologías depresivas, los cuales van desde 0,53 (para la escala HADS, con un punto de corte de 7) hasta 0,66 (para la escala PHQ-9, con un punto de corte de 10) según una revisión sistemática realizada el 2015 29.
Con respecto al análisis factorial exploratorio de los ítems de la escala EPD-4, el resultado obtenido también es consistente con el encontrado en la validación de la escala a lápiz y papel 16. En ambos estudios se determinó que la escala EPD-4 es unifactorial y que el tercer ítem (aquel que evalúa anhedonia) es el que tiene mayor relación con depresión, teniendo la carga factorial más alta. La anhedonia es un elemento muy importante en la patología depresiva, siendo considerada un síntoma cardinal por el DSM-5 y la CIE-10 30. La importancia del ítem que evalúa la anhedonia y su mayor contribución a la escala EPD-4 se confirma al obtener en nuestro estudio el más alto valor de discriminación (4,21; IC-95 %: 2,46 a 5,96), el mayor coeficiente de correlación con el resto de la escala (0,7182) y la mayor caída del alfa de Cronbach cuando este ítem es retirado (hasta 0,7226). Los valores de discriminación de los 4 ítems de la EPD-4 están en el rango de «muy altos» (>1,7) 31. Por otro lado, se encontró que el segundo ítem (reactividad del ánimo) es el que tiene mayor grado de dificultad en general, necesitando un mayor nivel de depresión para alcanzar cada uno de los puntajes. Dicho ítem corresponde a una característica de la depresión melancólica y se encuentra relacionado con el concepto de anhedonia (el ítem con mayor contribución de la escala) (1, 16).
La consistencia interna de la EPD-4 en nuestro estudio la podemos considerar adecuada, considerando que se obtuvo un alfa de Cronbach de 0,812 (>0,7) 32. Este valor se encuentra dentro del rango de los alfa de Cronbach calculados para otras escalas que evalúan la depresión. El resultado es mayor en comparación al alfa de Cronbach de 0,6603 de la EPD-4 y 0,7359 de la EPD-6 validadas en el Perú a lápiz y papel 16; y es similar al de la escala corta de Zung validada en Colombia (0,803) 27. Por otro lado, el estudio que validó la CES-D en el Perú halló un alfa de Cronbach de 0,93 17; mientras que el estudio realizado en los universitarios de Colombia encontró para el PHQ-9 un alfa de Cronbach de 0,83 33.
El omega de McDonald de la EPD-4 en nuestro estudio fue de 0,8229, lo cual es considerado satisfactorio al ser mayor a 0,7 34. Este valor es mayor que el de 0,75 de la ZSDS validada en el Perú a lápiz y papel. En contraste, un estudio de validación de la CES-D en nuestro medio encontró un omega de McDonald de 0,90 17.
Con respecto a las limitaciones del estudio, el método de muestreo por bola de nieve y limitado a las personas con acceso a Internet no permite obtener una muestra representativa de la población peruana. Aunque esto puede afectar de manera importante los estimados de prevalencia de depresión, el efecto sobre la evaluación de las características psicométricas de la escala es menor. Asimismo, hay que considerar que por razones de factibilidad se usó como patrón de referencia la CES-D en vez de una entrevista diagnóstica, tal como la Entrevista Clínica Estructurada para trastornos del DSM (SCID), la Entrevista Diagnóstica Internacional Compuesta (CIDI) o la Entrevista Neuropsiquiátrica Internacional (MINI), empleadas idealmente en los estudios de validación 35. Finalmente, tomando en cuenta que todos los participantes del estudio fueron mayores de 18 años, se sugiere que en una investigación posterior se pueda examinar la validez de esta escala en adolescentes, ya que es una población significativa y vulnerable en nuestro país, con una prevalencia de depresión que varía entre 1,2 a 66 % 36.
CONCLUSIONES
La EPD-4 en línea es un instrumento con propiedades psicométricas adecuadas, que posee buena consistencia interna, validez factorial y eficacia diagnóstica para detectar la depresión de acuerdo con la CES-D. Todos sus ítems tienen alta discriminación basada en la metodología de la teoría de respuesta al ítem.