1. Introducción
El conteo de larvas de boquichico (Prochilodus nigricans) es una técnica aplicada en la acuicultura con el objetivo de determinar la eficiencia de la etapa de inducción hormonal en el proceso de reproducción (David-Ruales et al., 2018); conocer la cantidad de larvas fecundadas en cultivo garantiza las condiciones óptimas para su salud y crecimiento (Rojas & Salazar, 2018).
Gran parte del sector acuícola adoptan mecanismos tradicionales de conteo de peces (Espinoza et al., 2019), requiriendo trabajo humano intensivo que consume tiempo; lo cual, agregan incertidumbre al conteo considerándose práctica lenta (Yang et al., 2021).
El conteo automático a diferencia de la técnica tradicional es una solución para optimizar el proceso, dado a su precisión de conteo y disminución del tiempo. Para Bellemo et al. (2019), su puesta en producción no es tarea fácil, ya que deben cumplir ciertos criterios de evaluación como características del pez, iluminación del ambiente y turbidez del agua.
En la región Amazonas, el Centro de Investigaciones Seasme del Instituto de Investigaciones de la Amazonía Peruana (IIAP), concebida para lograr el desarrollo sostenible en las comunidades nativas a través de la transferencia tecnológica, aplica la técnica de conteo por volumetría para conocer la eficiencia de la etapa de inducción hormonal en el proceso de reproducción inducida (Santos et al., 2020). Para realizar esta técnica se requiere como mínimo dos personas los cuales aplican este cálculo para conocer el universo de la producción (França et al., 2019). Los datos son registrados en un cuaderno de apuntes manteniendo un histórico que a posteriori a consecuencia de la manipulación continua lleguen a deteriorarse y alteren la información (Mejia et al., 2018). En tal sentido, identificamos que la aplicación de esta técnica arroja márgenes de error superior al 30% tardando un tiempo promedio de 2 horas (Yu et al., 2022).
La tecnología inadecuada para el manejo de líquidos es otro factor que repercute en los resultados del conteo y en consecuencia a los cálculos tradicionales de la producción (Lu & Luo, 2020), implicando daños mecánicos y pérdida de larvas por factor estrés (Hernández et al., 2019).
Para Cisneros-Montemayor & Cisneros-Mata (2018), los sistemas de visión artificial son una alternativa priorizable en el sector acuícola, resaltando sus ventajas de automatización, precisión y fiabilidad. Hernández-Ontiveros et al. (2018), en su investigación realizada en la estación “Brekarand” México implementó un contador automático integrado, tomando como objeto de estudio dos especies de tamaños variantes entre 0,5 y 2,3 cm en un ambiente controlado, obteniendo precisión promedio de 96,64% en el recuento de peces.
En un estudio realizado por Sánchez-Guashpa et al. (2021), aplicó el reconocimiento de peces utilizando redes neuronales convolucionales, constituido por 4 capas convolucionales al cual se aplicaron filtros de extracción de características de entrada a la red considerando 32, 64, 128 y 256 respectivamente. El modelo se entrenó con un set de datos de 36 140 imágenes de especies categorizadas en 52 géneros correspondientes a 94 especies, logrando un 97,55% de precisión en el sistema propuesto.
El objetivo de la presente investigación fue automatizar la técnica de conteo utilizando la red neuronal MaskRCNN para la identificación y segmentación de larvas de boquichico con dimensiones de 3 a 5 ml.
2. Materiales y métodos
Localización del estudio
La investigación se desarrolló en el Centro de Investigación Seasme del Instituto de Investigaciones de la Amazonía Peruana, Amazonas, Centro Poblado Nuevo Seasme, Distrito Nieva, Provincia Condorcanqui, Región Amazonas, al noroeste del Perú. Se encuentra a una altitud promedio de 190 msnm, con temperatura media de 26 °C y una precipitación media anual de 3121 mm (Mayca-Pérez et al., 2017).
Material biológico
La selección de reproductores se realizó aplicando criterios de selección no invasiva; es decir en hembras vientre abultado y flácido, papila rojiza y dilatada; en machos la expulsión de semen y emisión de ronquidos (Colorado et al., 2017). Se consideró 20 machos y 10 hembras. Posteriormente, se trasladaron los reproductores en baldes de PVC a tanques de tratamiento hormonal previamente acondicionados (Contreras-Sánchez et al., 2020).
Utilizamos el protocolo de inducción hormonal que establece aplicar una estrategia de dos dosis de hormona en hembras estimulante 10% y desencadenante 90%, en el caso los machos estimulantes 50% y desencadenante 50%, con intervalo de 10 a 12 horas entre dosis, para el tratamiento se usó la hormona acetato de buserelina 0,0084 aplicando 1,3 ml/kg para hembras y 0,25 - 0,5 ml/kg en machos, inyectando intraperitoneal en la cavidad corporal del boquichico (Delgado et al., 2019).
El desove de peces lo realizamos de manera semi-natural con suaves masajes, recolectado los óvulos y esperma con el cual se realizó la fecundación aplicando movimientos suaves con plumas (Díaz et al., 2021). Los óvulos fecundados fueron trasladados a incubadoras de fibra de vidrio de 200 litros, colocando de 1000 a 1500 ml en cada una, tomando en cuenta el flujo de agua de 1,3 a 1,8 litros/minuto (Moncaleano et al., 2018).
Transcurrido aproximadamente 14 +-2 horas se obtuvo el objeto de estudio, el cual se cosechó aplicando la técnica de sinfoneo, utilizando mangueras plásticas de 1 pulgada de diámetro las cuales trasportaron las larvas hasta los cosechadores que fueron colocados en el interior de un recipiente (Montes-Petro et al., 2019).
Prototipo
Adquisición de la imagen
El prototipo utilizado para la adquisición de las imágenes consiste en una pecera de vidrio ajustada sobre un soporte metálico acondicionado para una cámara web; con dimensiones: ancho 20 cm, largo 34 cm y 5,4 cm de alto. Soporte metálico: alto 33,06 cm, ancho 25,6 cm, largo 39,6 cm. La cámara debe ir ubicada en el centro del soporte metálico enfocando en su totalidad a los bordes del interior de la pecera (Figura 1).
Las imágenes fueron tomadas en un ambiente con luz controlada, con iluminación de tipo difusa de fluorescente en horarios de 9 a 11 de la mañana. Así mismo, a fin de contrastar el objeto de estudio utilizamos una cabina con fondo azul.
Se utilizó una cámara Sony IMX415 USB 2.0, con resolución de 3840(H) x 2160(V) a una distancia de 25 cm desde la base de cámara hasta la pecera. Consideramos 10 muestras controladas, de las cuales capturamos 60 imágenes para cada una, haciendo un total de 600 y 158 utilizadas para el entrenamiento.
Etiquetado de las imágenes
Este proceso consiste en la separación de cada uno de los objetos presentes en la escena de la imagen (Khokher et al., 2022), para esta etapa lo que se busca es separar las larvas del fondo, de tal modo que se obtengan únicamente las propiedades relacionadas con el objeto de estudio y no de objetos extraños.
Para este proceso se utilizó el software LabelImg, que permite marcar las larvas de la imagen y convertir sus coordenadas en archivos XML. Posteriormente, los archivos XML de la carpeta DATASET se convirtieron a un formato “coco”, para que la red neuronal pueda ser entrenada. LarvasUpdate.json contendrá la información de todas las imágenes y sus coordenadas almacenadas en un solo archivo (Anexo).
Entrenamiento de la red neuronal
Los algoritmos de entrenamiento modifican cada neurona para identificar a lo largo de las iteraciones el patrón que mejor se ajusta al objetivo (Hee-Jee et al., 2020). Para este proceso utilizamos el lenguaje de programación Python 3.9 y las librerías numpy 1.22.3, tensorflow 2.8.0 y pillow 9.1.0.
Para el entrenamiento de la red seleccionamos 600 imágenes de las cuales 158 fueron utilizadas. Se entrenó con un rango de 60 minutos mediante la red neuronal MaskRCNN. El equipo utilizado fue una laptop Windows 10 de 8GB de memoria RAM, tarjeta gráfica NVIDIA GeForce GTX 1650 y procesador Intel Core I5.
A continuación, se explica el proceso de entrenamiento de la red. La red “LARVA” utiliza 2 clases (background y larva) 64 pixeles como mínimo y 512 máximo para las imágenes, 400 épocas de entrenamiento con 5 validaciones. Las imágenes fueron divididas en 16 filas y 16 columnas y contados por secciones para luego acumularlo en un contador. Se cargó el DATASET con dos tipos de valores: 80% para el entrenamiento y 20% para la evaluación. Luego se cargó la red MaskRCNN para el entrenamiento en formato “coco”, indicando las capas que se entrenan: logística, caja, mascara y de clases. Con el objetivo de minimizar el error en el entrenamiento, se utilizó un paso (step) pequeño igual a 0,0000001 con 140 épocas. Culminado las configuraciones, se entrenó el algoritmo por un período de 60 minutos, esto a fin de llegar a un ‘loss’ bajo. Finalizado el entrenamiento, se obtuvo una carpeta llamada “logs” que contenía todos los modelos entrenados que sirvieron para reentrenar; estos archivos contenían la información necesaria para hacer predicciones en el futuro. La evaluación (Figura 2) muestra que a partir del “step” 51 empieza a subir, razón por la cual se eligió cualquier “step” menor a 51. La red se entrenó hasta el step 63 (Figura 3) y fue seleccionado el step 31.
La Figura 4 muestra el proceso que se realizó para el entrenamiento de la red.
T1 (ST) | T2 (SVA) | ||||||
Repetición | Precisión (%) | Error (%) | Tiempo (s) | Precisión (%) | Error (%) | Tiempo (s) | |
1 | 59,4 | 40,6 | 2670 | 91,0 | 9,0 | 59 | |
2 | 56,8 | 43,3 | 2030 | 91,3 | 8,8 | 61 | |
3 | 62,3 | 37,8 | 2300 | 90,1 | 10,0 | 63 | |
4 | 67,0 | 33,0 | 2300 | 92,4 | 7,7 | 64 | |
5 | 70,5 | 29,5 | 2698 | 94,0 | 6,1 | 63 | |
6 | 62,9 | 37,1 | 1870 | 95,2 | 4,8 | 59 | |
7 | 65,7 | 34,4 | 1608 | 94,0 | 6,1 | 58 | |
8 | 58,8 | 41,3 | 1495 | 92,1 | 7,9 | 59 | |
9 | 67,2 | 32,8 | 1530 | 94,5 | 5,6 | 62 | |
10 | 73,8 | 26,3 | 1592 | 91,9 | 8,1 | 62 |
T= Tratamiento; ST= Sistema tradicional; SVA: Sistema de visión artificial.
Diseño experimental y análisis de datos
Se utilizó un diseño completo al azar con dos sistemas de conteo de larvas: sistema tradicional - ST y sistema de visión artificial - SVA. Cada sistema tuvo 10 repeticiones, con una muestra de 2000 larvas de boquichico (Figura 5). Los datos fueron registrados en una cartilla física y digital (Excel); se armó un consolidado en una matriz general de datos y fueron procesados en el software estadístico InfoStat versión 2019. El procesamiento de los datos fue mediante el análisis T-STUDENT para dos muestras independientes con un nivel de significancia de 5%.
Conteo tradicional
Para la obtención del universo de larvas eclosionadas, utilizamos el método de conteo por volumetría, considerando 1 litros de agua como población y 0,25 ml de muestra, realizamos un total de 10 repeticiones, para posteriormente realizar la aproximación total utilizando la regla de tres simples directas (x será igual al número de larvas encontradas en 0,25 ml de agua (L), multiplicado por cantidad total de agua existente en 1 litro y dividido entre 0,25 ml de a muestra).
Conteo por visión computacional
Para este proceso, capturamos una imagen de la pecera mediante una cámara web para luego ser tratada mediante el sistema de visión artificial (x = L). L: Total de larvas encontradas en un litro de agua; x: Total de larvas.
3. Resultados y discusión
En la Tabla 1 se muestra los resultados obtenidos para el grupo control y grupo experimental.
Precisión de conteo de larvas
La prueba T- Student muestra para la variable precisión que p-valor es menor al 0,05 de significancia, cayendo en la región de rechazo; por lo que se rechaza la hipótesis nula y se acepta la hipótesis alterna; dónde los sistemas de conteo de larvas son diferentes.
En la Figura 6 se muestra las medias para la precisión del conteo con los dos sistemas; apreciando que la diferencia reportada por la prueba T, debido a que el sistema de visión artificial mostró un mayor nivel de precisión (92,65%), respecto al sistema tradicional (64,44%).
El sistema implantado es óptimo, dado que p-valor es menor a 0,05; la precisión en el conteo de peces es fundamental, influyendo en los valores morales de la organización y evitando la disconformidad de negocio (Meza & Candelaria, 2017). Por su parte Hee-Jee et al. (2020) constatan que un sistema es eficiente y tiene mayor relevancia si sus cálculos de conteo son exactos. De esto, el sistema de visión artificial mejora el proceso de conteo, permitiendo precisiones superiores al 90%.
Error de conteo
En la Figura 7 se muestran las medias para el error del conteo con los dos sistemas; apreciando que la diferencia reportada por la prueba T, debido a que el sistema de visión artificial mostró un menor nivel de error (7,41%); porcentaje de error que puede ser reducido realizando modificaciones en la pecera utilizada, puesto a que esta registra puntos muertos el cual aumenta el porcentaje de error de conteo, respecto al sistema tradicional (35,61%).
El sistema de visión artificial tiene márgenes de error menores al 10% cumpliendo con los parámetros de error aceptable del sector acuícola, dado a que p-valor es menor a 0,05; tal y como lo respalda el estudio de Vásquez-Salazar & Cardona-Mesa (2017); del mismo modo Puig-Pons et al. (2019) obtuvo errores menores a 10% es su estudio aplicado en España cumpliendo con los requisitos impuestos por la Comisión Internacional para la Conservación del Atún Atlántico.
Tiempo de conteo
En la Figura 8 se muestra las medias para el tiempo de conteo con los dos sistemas; apreciando que la diferencia reportada por la prueba T, es debido a que el sistema de visión artificial mostró un menor tiempo (61 s), respecto al sistema tradicional (2009,3 s).
El sistema de visión artificial reduce el tiempo de conteo (p-valor < 0,05), tal y como lo señala França et al. (2019); Vallejo et al. (2018) obtuvieron los mismos valores para p-valor posterior a la ejecución de su investigación. La Figura 8 muestra la diferencia significativa de los tratamientos aplicados, resaltando la eficiencia del sistema de visión artificial el cual registra un promedio de 61 segundos por tratamiento, Rosas-Echevarría et al. (2019) afirman que para obtener un sistema eficiente debe existir variación entre tratamientos aplicados.
4. Conclusiones
En función a los resultados de la prueba estadística T-Student, se concluye que la investigación ha logrado mejorar la técnica de conteo, bajo los 3 pilares del estudio: precisión (92,65%), disminución del error de 35,61% a 7,41% y disminución de tiempo de conteo de 2009,3 a 61 s. Este estudio evidencia que el contador automático de larvas basado en visión artificial influyó positivamente respecto al sistema tradicional, siendo una solución óptima para el conteo.
El sistema se desarrolló de manera que se pueda replicar en el sector acuícola; en función a su efectividad, debido a que los equipos son de bajo costo y el software es de código libre.
Para una posterior investigación se recomienda validar el prototipo realizando correcciones respecto a los bordes internos de la pecera y emplear mayor número de larvas.