INTRODUCCIÓN
La resistencia bacteriana se constituye como un importante problema de salud mundial, asociada a un incremento en la pérdida de productividad económica y mortalidad humana. Se estima el deceso anual de aproximadamente 23 000 personas en los Estados Unidos como resultado de infecciones por bacterias resistentes a antibióticos 1, destacando entre ellas Escherichia coli, una bacteria intrínsecamente susceptible a casi todos los antibióticos relevantes, pero con alta capacidad de adquirir genes de resistencia por transferencia genética horizontal 2.
E. coli puede causar infecciones intestinales y extraintestinales, limitando su carácter patógeno a un grupo denominado Escherichia coli diarreogénica (DEC), que se clasifica dependiendo de su patogénesis en siete patotipos: E. coli enteropatógena (EPEC), enterohemorrágica (EHEC), enterotoxigénica (ETEC), enteroinvasiva (EIEC), enteroagregativa (EAEC), adherente difusa (DAEC) y adherente invasiva (AIEC), responsables del 40% de los casos de diarrea aguda en países en vías de desarrollo 3.
En el Perú, la vigilancia de la resistencia bacteriana se realiza principalmente mediante métodos fenotípicos como el de Kirby-Bauer o la concentración mínima inhibitoria (MIC) recomendadas por el Instituto de Estándares Clínicos y de Laboratorio (CLSI). La mayoría de los estudios se avocan a la detección fenotípica de betalactamasas de espectro extendido (BLEE) y resistencia a quinolonas, aunque en años recientes se viene implementando el estudio de genes de resistencia por métodos moleculares, como el PCR y la secuenciación Sanger 4.
En años recientes, se viene apostando por el uso del secuenciamiento del genoma completo para caracterizar genes de virulencia de diversas DEC e identificar relaciones filogenéticas entre patotipos 5. Esta área ha sido poco explorada en el Perú, por lo que el objetivo del presente trabajo es describir las características del resistoma y genómica comparativa de diferentes DEC de la ciudad de Lima.
MENSAJES CLAVE
Motivación para realizar el estudio: Se ha observado un incremento de infecciones gastrointestinales por Escherichia coli diarreogénicas (DEC) resistentes a antibióticos en los últimos años, cuya caracterización genómica viene siendo poco explorada en el Perú.
Principales hallazgos: Los patotipos de DEC de Lima, Perú, poseedores de determinantes de resistencia a betalactámicos y quinolonas son diversos, tanto de manera molecular como filogenética.
Implicancias: El secuenciamiento genómico permite una comprensión profunda de los continuos cambios y adaptaciones que sufren patógenos como DEC, por lo que su implementación sería importante para la vigilancia de la resistencia antimicrobiana en el Perú.
EL ESTUDIO
Se trabajó con 14 aislamientos de E. coli recuperados por el Instituto Nacional de Salud (INS), con antecedente de haber provocado enfermedad diarreica aguda en pacientes de la ciudad de Lima entre 2017 y 2018, tomando como criterio de selección el perfil de sensibilidad antimicrobiana por disco difusión previamente evaluada por el laboratorio (Anexo 1).
Los aislamientos se reactivaron en caldo tripticasa soya (Merck, Alemania) a 37 °C durante 68 horas. Posteriormente, se sembraron en placas de agar MacConkey (Merck, Alemania) y se incubaron a 37 °C durante 18 a 24 horas. Se confirmó E. coli mediante pruebas bioquímicas convencionales. Los patotipos fueron caracterizados en base a cebadores según el Anexo 2.
La extracción del ADN de los aislamientos se realizó con el kit DNeasy Blood & Tissue (Qiagen, Alemania). Se evaluaron la concentración y la calidad del ADN mediante espectrofotometría (Denovix, EE. UU.) y con un fluorómetro Qubit 3.0 (Invitrogen, Malasia). La elaboración de bibliotecas de secuenciamiento se realizó con el kit Nextera XT (Illumina, EE. UU.), y el secuenciamiento genómico con el equipo MiSeq (Illumina, EE. UU.).
Se evaluó la calidad de las secuencias obtenidas con FastQC v0.11.5. Se removieron los adaptadores y las bases nitrogenadas de baja calidad con el programa Trimmomatic v0.38 6. Las secuencias se ensamblaron de novo empleando el pipeline A5-miseq 7. La identificación del género y remoción de contigs contaminados se realizó con el programa Kraken 8. Los perfiles alélicos y los secuenciotipos (ST, por sus siglas en inglés, sequence type) de los genomas obtenidos se asignaron de acuerdo con la base de datos del esquema de tipificación multilocus (MLST, por sus siglas en inglés, multilocus sequence typing) para E. coli según Achtman (http://pubmlst.org/) utilizando el programa MLST v2.10. La asignación de complejos clonales y la creación de un árbol recubridor mínimo (MST, por sus siglas en inglés, minimum spanning tree) se realizó mediante el programa BioNumerics v7.5 (Applied Maths).
Con la herramienta BLAST se buscaron los genes asociados a la virulencia de los patotipos de E. coli, según el Anexo 2. Se realizó la predicción de secuencias codificantes usando el programa Prodigal v2.6.3. Se identificaron los genes homólogos de las secuencias a partir de una biblioteca de genes construida utilizando todos los genomas completos disponibles en el GenBank, utilizando el algoritmo BLAST seleccionando los alineamientos mayores de 90% de identidad y cobertura mayor al 60% con la referencia. El código empleado para la anotación se encuentra disponible en http://github.com/OrsonMM/Blast-score-ratio-for-genomics.
Para la asignación de los filogrupos, se empleó el esquema de tipificación de Clermont 9, basado en una PCR in silico utilizando cebadores diseñados para cada filogrupo con el software disponible en https://github.com/A-BN/ClermonTyping. Para la detección de genes de resistencia antibiótica, se utilizó la base de datos online CARD 10 ) que incluye genes cromosomales y plasmídicos. Finalmente, todas las secuencias obtenidas durante el estudio se depositaron en la base de datos del GenBank (Bioproject: PRJNA650130).
En cuanto a la genómica comparativa, se anotaron los genomas ensamblados con Prokka v1.12 11 ) con un valor e de 10-9. Los resultados de la anotación se subieron al programa BPGA v1.3 12 ) para calcular el número de genes del genoma central, accesorio y genes únicos con un valor >0,95 de identidad. Como último paso, se utilizó la matriz resultante de anotación por patotipo para el análisis comparativo entre grupos utilizando VennPainter 13.
HALLAZGOS
Los 14 aislamientos fueron reconfirmados como E. coli mediante procedimientos microbiológicos convencionales. La confirmación de patotipos por PCR dio como resultado dos EHEC, dos EIEC, tres EPEC y siete ETEC (Tabla 1).
Tabla 1 Datos genómicos de los aislamientos de Escherichia coli diarreogénica en Lima, Perú.

EHEC: E. coli enterohemorrágica, EIEC: E. coli enteroinvasiva, EPEC: E. coli enteropatógena, ETEC: E. coli enterotoxigénica, ST: Sequence type, ND: No definido, no en contrado en la base de datos del esquema de tipificación multilocus (MLST).
La tasa de error de secuenciamiento evaluado mediante el uso de un control interno PhiX indicó una tasa del 0,35%. El Q30 empleado para seleccionar lecturas de buena calidad fue >80% por cada 150 pb. Los catorce genomas secuenciados tienen en promedio 184 contigs de alta calidad. Cada genoma se identificó como E. coli con más del 85% de identidad, obteniendo un contenido de GC del 50,4%. Se detectaron 10 ST diferentes por MLST (Figura 2), teniendo como principales hallazgos al ST11 asociado a EHEC, ST311 a EIEC y ST69 a EPEC.

Figura 2 Árbol recubridor mínimo de 14 perfiles alélicos del esquema de tipificación multilocus (MLST) de Escherichia coli diarreogénicas según Achtman incluidos en este estudio, diseñado con el programa BioNumerics v7.5. La leyenda indica cada secuenciotipo diferenciado por colores. Cada círculo representa un genotipo del MLST y el tamaño es proporcional al número de cepas que incluye cada uno.
El análisis in silico de patotipos encontró una relación directa con los resultados obtenidos por PCR (Figura 1). Los aislamientos EHEC presentaron los genes de la toxina Shiga (stx1 y stx2). Cuatro ETEC presentaron el gen de la enterotoxina termolábil (elt), dos presentaron la enterotoxina termoestable (st) y solo uno presentó ambos genes. La anotación reveló la presencia del gen eaeA dentro de las EPEC, y finalmente las EIEC poseían el gen ipaH.

Figura 1 Identificación molecular de genes asociados a patotipos, filogrupos y genes de resistencia antimicrobiana de Escherichia coli diarreogénica. Las casillas coloreadas indican la detección de los marcadores mientras que las incoloras indican su ausencia.
El esquema de tipificación de Clermont asignó cuatro genomas de E. coli al filogrupo A, cuatro a B1, uno a B2, tres a D y dos a E. Una revisión adicional reveló que los aislamientos EHEC peruanos pertenecían al filogrupo E, las EIEC a B1, las ETEC a A y D, y las EPEC a los filogrupos B1, B2 y C (Figura 1).
En el análisis relacionado con el resistoma, se detectaron genes que codifican betalactamasas; nueve genomas presentaron el gen ampC; cuatro poseían bla TEM1, y solo uno presentó bla CTX-M-15. Además, se detectaron genes de resistencia a las quinolonas. El gen gyrA con la mutación S83L se detectó en dos ETEC. El gen qnrS1 se encontró en todas las EIEC y en una ETEC, mientras que el gen qnrB10 se presentó en una EPEC (Figura 1).
El promedio de secuencias codificantes para los catorce genomas analizados fue de 5016. El número de genes del genoma accesorio varió entre 938 y 2133, mientras que el número de genes únicos varió entre 0 y 581. Finalmente, el número de genes del genoma central fue 2950 (Tabla 1).
El análisis funcional pangenómico detectó 2,17% de genes centrales, 2,04% de genes accesorios y 1,63% de genes únicos relacionados con la resistencia antimicrobiana usando las categorías de la enciclopedia de genes y genomas de Kyoto (KEGG) (Anexo 3). Además, la anotación empleando las categorías de clústeres de grupos ortólogos de proteínas (COG) detectaron que el 5,32% de los genes centrales, el 7,32% de los genes accesorios y el 10,22% de los genes únicos estaban relacionados con la pared celular y las proteínas de membrana (Anexo 4).
La genómica comparativa entre patotipos reveló 2950 genes del genoma central. Datos adicionales de agrupación de dos o tres patotipos se detallan en la Figura 3. Finalmente, detectamos una gran cantidad de genes ortólogos entre aislados EHEC y EIEC, así como una pequeña cantidad de genes compartidos dentro de EPEC y ETEC, para los cuales no hay información adicional sobre su nombre o función, siendo anotados como proteínas hipotéticas.
DISCUSIÓN
La E. coli diarreogénica es la principal causa de infecciones nosocomiales y adquiridas en la comunidad 14, y tiene una alta capacidad para desarrollar resistencia a los antimicrobianos. Es importante reportar las características genómicas de aislamientos patógenos para comprender la resistencia y patogénesis bacteriana que contribuirán con el monitoreo y la aplicación de nuevas acciones relacionadas con la salud pública local.
En el presente estudio, se detectaron nueve aislamientos de E. coli poseedores de genes de resistencia antibiótica por secuenciación genómica, siendo la más importante la presencia de CTX-M-15, TEM1 y ampC relacionados con la resistencia a betalactámicos. Los estudios indican la presencia de genes bla en aislados peruanos de E. coli BLEE-positivo, con altas tasas de frecuencia de CTX-M (54,7%) y TEM (13,2%) 15. Por otro lado, la detección de la betalactamasa tipo ampC es poco explorada en nuestra región, siendo principalmente una detección fenotípica con bajas frecuencias 16.
La resistencia a quinolonas por la mutación S83L en gyrA se presentó en dos ETEC, mientras que la presencia de qnr se detectó en dos EIEC, una EPEC y una ETEC. La resistencia a las quinolonas ya se había informado en el Perú, incluyendo cepas comensales debido a la fuerte influencia de la exposición persistente a estos antimicrobianos 17; sin embargo, son pocos los estudios centrados en el uso de marcadores moleculares para determinar la resistencia a las quinolonas. Además, el secuenciamiento genómico permitió encontrar genes adicionales relacionados con la resistencia a otros antibióticos. Por ejemplo, se reporta dos EIEC y dos EPEC con resistencia a STX y nueve aislamientos con resistencia a tetraciclinas.
La exploración de la relación entre patotipos (no taxonómica) y filogrupos (taxonómica) de E. coli mostró que las EPEC han sido reportadas mayormente dentro de los filogrupos B1 y B2 18, acorde con lo analizado aquí. Las EIEC se agrupan en tres filogrupos: A, E y B1 14, siendo B1 donde se ubicaron los aislamientos de este estudio. Por otro lado, las ETEC se encuentra mayormente dentro de A y D 19, donde los siete aislamientos evaluadas aquí también encajaron. En contraste, las EHEC resultaron ser el grupo más uniforme, estando asociadas al filogrupo E. Esto tiene una explicación evolutiva; el serotipo predominante de este grupo, O157: H7, deriva de una adquisición de genes de un aislamiento no patógeno O55: H7, llamada preEHEC 20.
El análisis pangenómico de E. coli diarreogénica usando las categorías KEGG permitió detectar un 2,17% de genes del genoma central involucrados en la resistencia antimicrobiana. Aunque en el análisis anterior solo se mostró información con respecto a 14 genes asociados con la resistencia, logramos detectar genes adicionales asociados con la resistencia, entre mutaciones y otros efectores; sin embargo, debido a la poca información disponible de estas moléculas en los aislamientos de E. coli, no profundizamos en el estudio de esas moléculas.
El análisis comparativo entre patotipos mostró que EHEC y EIEC comparten una gran cantidad de genes (n = 246), mientras que EPEC y ETEC presentaron la menor cantidad de genes compartidos (n = 2). Este último resultado es interesante, ya que contrasta con el trabajo realizado por Hazen et al. ( 18, quienes encontraron aislamientos híbridos de estos patotipos. Por otro lado, la mayoría de los estudios de genómica comparativa solo se basan en el estudio de diferencias y similitudes dentro de los mismos patotipos, por lo que este trabajo ofrece una primera mirada a la genómica comparativa entre diferentes patotipos, siendo uno de los primeros trabajos de esta temática en el Perú.
En conclusión, los aislados de E. coli diarreogénica de Lima, Perú, poseen genes de resistencia a múltiples fármacos, se ha detectado patotipos, ST y filogrupos con diversidad molecular y filogenética. Se sugiere continuar vigilando la resistencia de estas bacterias a los antimicrobianos con el secuenciamiento de nueva generación, puesto que esta información es de utilidad para la salud pública local.